본문 바로가기

Data Scientist3

[scikit-learn, python] machine learning 에 주로 사용되는 python module 이번 포스팅은 machine learning을 하려면 필수적으로 알아야할 library인 scikit-learn에 대해서 이야기하고자 합니다. 1. scikit-learn은 (소개) 머신러닝은 데이터에서 지식을 추출하고, 패턴을 학습하며, 예측을 수행할 수 있는 강력한 기술로, 현대의 많은 기술 혁신과 응용 프로그램에서 중심적인 역활을 합니다. 요즘은 딥러닝이 핫한거 아닌가? 라고 하실 하실 수 있겠지만, 딥러닝은 머신러닝에 속해 있습니다. 그리고 여전히 딥러닝 이외의 machine learning들이 최근 연구에서도 다양하게 사용되는 것을 연구하다보면 알수가 있습니다. 예를들어 netfilx에서 개인에게 작품을 추천할때에도 machine learning을 이용한다고 들었습니다. scikit-learn은.. 2024. 4. 4.
[python, pandas] Data scientist라면 알아야 할 기본 기능 1. Introduction Pandas module은 data scientist들이 가장 많이 사용하고 있는 모듈중 하나일 것입니다. 혹은 R 프로그래밍을 하셨던 분이라면, 유사하게 데이터를 다룰수 있도록 하는 모듈이 이 pandas일 것입니다. 주로 pandas는 pd로 줄여서 분석을 합니다. 이번 포스팅은 pandas에서 기본중에 기본기능에 대해서 이야기해보려고 합니다. 2. 기능들 실습에 사용되는 데이터는 다음에서 다운받으시면 됩니다. https://archive.ics.uci.edu/ml/datasets/iris UCI Machine Learning Repository: Iris Data Set Data Set Characteristics: Multivariate Number of Instanc.. 2023. 2. 15.
[R] 쉽게 배우는 R programming 기초 (1) (vector, matric) R에서 기본적인 것들을 배워 보도록 하겠습니다. 항상 프로그래밍 하면서 느낀것이지만, 기본이 중요하다고 생각합니다. !! 기초를 잘 알면 어떤 알고리즘이라도 만들 수가 있다고 생각합니다. 1. R vector a 2020. 6. 22.