본문 바로가기

기본2

[python, pandas] Data scientist라면 알아야 할 기본 기능 1. Introduction Pandas module은 data scientist들이 가장 많이 사용하고 있는 모듈중 하나일 것입니다. 혹은 R 프로그래밍을 하셨던 분이라면, 유사하게 데이터를 다룰수 있도록 하는 모듈이 이 pandas일 것입니다. 주로 pandas는 pd로 줄여서 분석을 합니다. 이번 포스팅은 pandas에서 기본중에 기본기능에 대해서 이야기해보려고 합니다. 2. 기능들 실습에 사용되는 데이터는 다음에서 다운받으시면 됩니다. https://archive.ics.uci.edu/ml/datasets/iris UCI Machine Learning Repository: Iris Data Set Data Set Characteristics: Multivariate Number of Instanc.. 2023. 2. 15.
[R] Machine learning (1) - Linear regression machine learning에서 가장 기본적인 linear regression에 대해 포스팅하려고 합니다. 포스팅해야할 주제는 많은데 정리가 잘 안되네요~ ㅎㅎㅎ 요번에 machine learning 관련 내용 멘토링을 하다보니 이 포스팅을 하게 되었습니다. ㅎㅎㅎ 이론적인 내용보다는 어떻게 돌린다 정도로만 포스팅 하도록 하겠습니다. (통계학은 공부중이라 ㅎㅎ) 시작하도록하겠습니다. 우선 linear regression은 단순하게 말해서 종속변수와 독립변수의 관계를 선형식으로 나타낸다! 라고 생각하시면 됩니다. regression이라는 개념은 종속변수를 독립변수로 설명해보자 입니다. 연습용 데이터의 경우 R에서 유명한 package중 하나인 ggplot2에서 포함되어있는 diamonds라는 데이터셑입니.. 2020. 7. 8.