본문 바로가기

머신러닝3

[머신러닝] K-means 알고리즘을 배우기 1. Intro  대부분의 머신러닝 알고리즘은 라벨이 있는 데이터를 예측하는데 유용합니다. 이를 Supervised learning (지도 학습)이라고 합니다. 하지만 라벨이 없는 데이터 세트를 처리해야할 때가 많습니다. 이러한 문제는 Unsupervised learning비지도 학습 기법으로 해결할 수 있습니다. K-means 알고리즘은 데이터 세트를  K개의 클러스터로 나누는 비지도 학습 알고리즘입니다. 유사한 방법으로는 KNN방법이 있습니다. 해당 방법은 추후에 설명하도록 하겠습니다. 2. K-means 알고리즘의 역활 K-means 알고리즘은 데이터를 주어진 클러스터 수로 분할합니다. 각 클러스터 내의 데이터 포인트는 유사하고, 다른 클러스터의 포인트와는 차이가 큽니다. 유사성은 주로 유클리드 거.. 2024. 5. 27.
[scikit-learn, python] machine learning 에 주로 사용되는 python module 이번 포스팅은 machine learning을 하려면 필수적으로 알아야할 library인 scikit-learn에 대해서 이야기하고자 합니다. 1. scikit-learn은 (소개) 머신러닝은 데이터에서 지식을 추출하고, 패턴을 학습하며, 예측을 수행할 수 있는 강력한 기술로, 현대의 많은 기술 혁신과 응용 프로그램에서 중심적인 역활을 합니다. 요즘은 딥러닝이 핫한거 아닌가? 라고 하실 하실 수 있겠지만, 딥러닝은 머신러닝에 속해 있습니다. 그리고 여전히 딥러닝 이외의 machine learning들이 최근 연구에서도 다양하게 사용되는 것을 연구하다보면 알수가 있습니다. 예를들어 netfilx에서 개인에게 작품을 추천할때에도 machine learning을 이용한다고 들었습니다. scikit-learn은.. 2024. 4. 4.
[R] Machine learning (1) - Linear regression machine learning에서 가장 기본적인 linear regression에 대해 포스팅하려고 합니다. 포스팅해야할 주제는 많은데 정리가 잘 안되네요~ ㅎㅎㅎ 요번에 machine learning 관련 내용 멘토링을 하다보니 이 포스팅을 하게 되었습니다. ㅎㅎㅎ 이론적인 내용보다는 어떻게 돌린다 정도로만 포스팅 하도록 하겠습니다. (통계학은 공부중이라 ㅎㅎ) 시작하도록하겠습니다. 우선 linear regression은 단순하게 말해서 종속변수와 독립변수의 관계를 선형식으로 나타낸다! 라고 생각하시면 됩니다. regression이라는 개념은 종속변수를 독립변수로 설명해보자 입니다. 연습용 데이터의 경우 R에서 유명한 package중 하나인 ggplot2에서 포함되어있는 diamonds라는 데이터셑입니.. 2020. 7. 8.