본문 바로가기

pandas4

[python] loop문 말고 대세는? Vectorization?! 안녕하십니까. 오랜만에 글을 올립니다. 1. intro python에서 자주 사용되는 문법중 하나는 단언코 loop문일 것 입니다. 그런데 최근 이 loop문보다 효율적인 방법이 있다고 하여 정리해서 올려보자 합니다. loop문은 수많은 반복 (때에 따라서 수십만이상)을 할때 주로 사용할 수 있습니다. 그런데 loop문의 단점은 몇 시간동안 모든 반복을 마치고나서 결과가 잘못되었구나를 알아차리는 경우가 있습니다. 그렇기 때문에 loop를 일부 대체할 수 있는 Vectorization(백터화)의 소개는 중요하다고 생각이 듭니다. 2.백터화란? dataset에서 numpy에서 사용되는 array operation을 구현하는 기술입니다. for문보다는 모든 요소에 한번에 적용을 시킬 수가 있습니다. 2-1. .. 2024. 1. 2.
[python, pandas] Data scientist라면 알아야 할 기본 기능 1. Introduction Pandas module은 data scientist들이 가장 많이 사용하고 있는 모듈중 하나일 것입니다. 혹은 R 프로그래밍을 하셨던 분이라면, 유사하게 데이터를 다룰수 있도록 하는 모듈이 이 pandas일 것입니다. 주로 pandas는 pd로 줄여서 분석을 합니다. 이번 포스팅은 pandas에서 기본중에 기본기능에 대해서 이야기해보려고 합니다. 2. 기능들 실습에 사용되는 데이터는 다음에서 다운받으시면 됩니다. https://archive.ics.uci.edu/ml/datasets/iris UCI Machine Learning Repository: Iris Data Set Data Set Characteristics: Multivariate Number of Instanc.. 2023. 2. 15.
[pandas, DataFrame] ValueError: The truth value of a Series is ambiguous. Use a.empty, a.bool(), a.item(), a.any() or a.all(). 에러해결 최근 급하게 pandas를 써야되서 기초부터 배우기 보다는 중간중간 찾으면서 일을 진행중에 있는데, 다음과 같은 에러가 떳습니다. # 다음과 같이 진행하였을때, Filter_mat_1= Filter_mat['img_name'][Filter_mat['variance1']==1&Filter_mat['variance2']!=1] # 아래와 같은 에러가 뜹니다. ValueError: The truth value of a Series is ambiguous. Use a.empty, a.bool(), a.item(), a.any() or a.all(). 이 오류를 구글링을 해보니까. "and", "or" 대신에 "&", "|" 이걸 사용하면된다. 라는 답변을 보았는데, 이미 그걸 쓰고 있는데..... 무슨이유일까 .. 2022. 9. 8.
참고할 블로그들 1.애드센스 관련 diesick.tistory.com/entry/%EC%95%A0%EB%93%9C%EC%84%BC%EC%8A%A4-%EB%AC%B4%ED%9A%A8-%ED%8A%B8%EB%9E%98%ED%94%BD-%EB%8C%80%EB%B9%84%EB%B0%A9%EB%B2%95 애드센스 무효 트래픽 대비방법 구글 애드센스 무효 트래픽 방지 방법 "계정이 일시적으로 정지되었으며, 이로 인해 광고 게재가 중단되었습니다. 정책 센터에서 계정 정지의 원인을 찾아보시기 바랍니다." 구글 애드센스 광고 diesick.tistory.com 2. python 혹은 프로그래밍 관련 technote.kr/300 CRLF / LF / CR 에 대한 이해 CR : Carriage Return (\r) LF : Line Fe.. 2020. 12. 17.