본문 바로가기

Machine learning7

[머신러닝] K-means 알고리즘을 배우기 1. Intro  대부분의 머신러닝 알고리즘은 라벨이 있는 데이터를 예측하는데 유용합니다. 이를 Supervised learning (지도 학습)이라고 합니다. 하지만 라벨이 없는 데이터 세트를 처리해야할 때가 많습니다. 이러한 문제는 Unsupervised learning비지도 학습 기법으로 해결할 수 있습니다. K-means 알고리즘은 데이터 세트를  K개의 클러스터로 나누는 비지도 학습 알고리즘입니다. 유사한 방법으로는 KNN방법이 있습니다. 해당 방법은 추후에 설명하도록 하겠습니다. 2. K-means 알고리즘의 역활 K-means 알고리즘은 데이터를 주어진 클러스터 수로 분할합니다. 각 클러스터 내의 데이터 포인트는 유사하고, 다른 클러스터의 포인트와는 차이가 큽니다. 유사성은 주로 유클리드 거.. 2024. 5. 27.
[Deep learning 공부] 딥러닝 공부 포스팅링크 업로드 제대로 공부해보기 위한 커리큘럼! 1. 기초 지식 학습수학 및 통계 선형대수학 : 벡터, 행렬, 행렬곱, 고유값, 고유벡터미분방정식 및 미적분학 : 편미분, 기울기, 체인룰확률 및 통계 : 확률 분포, 기대값, 분산, 조건부 확률프로그래밍python 프로그래밍 : 기본 문법, 자료 구조, 함수 클래스라이브러리 : Numpy, Pandas, Maplotlib2. 기초 머신러닝기초개념 : 지도학습, 비지도 학습, 분류, 회귀기본 알고리즘 : 선형회귀, 로지스틱 회귀, K-Nearest-Neighbor, 결정 트리, SVM평가 방법 : 교차 검증, 과적합과 과소적합, ROC곡선3. 딥러닝 기초신경망 기본 개념 : 퍼셉트론, 활성화 함수, 역전파 알고리즘프레임워크 소개 : TensorFlow, Keras, Py.. 2024. 5. 24.
[scikit-learn, python] machine learning 에 주로 사용되는 python module 이번 포스팅은 machine learning을 하려면 필수적으로 알아야할 library인 scikit-learn에 대해서 이야기하고자 합니다. 1. scikit-learn은 (소개) 머신러닝은 데이터에서 지식을 추출하고, 패턴을 학습하며, 예측을 수행할 수 있는 강력한 기술로, 현대의 많은 기술 혁신과 응용 프로그램에서 중심적인 역활을 합니다. 요즘은 딥러닝이 핫한거 아닌가? 라고 하실 하실 수 있겠지만, 딥러닝은 머신러닝에 속해 있습니다. 그리고 여전히 딥러닝 이외의 machine learning들이 최근 연구에서도 다양하게 사용되는 것을 연구하다보면 알수가 있습니다. 예를들어 netfilx에서 개인에게 작품을 추천할때에도 machine learning을 이용한다고 들었습니다. scikit-learn은.. 2024. 4. 4.
[Python] Data science - numpy 기초 (1) 오늘 포스팅은 data science에서 중요한 모듈중 하나인 numpy에 대해서 배워보도록 하겠습니다. 최근 기계학습(머신러닝, machine learning)과 deep learning에 대한 관심이 높아지면서 그에 따른 프로그래밍 언어와 모듈들이 같이 중요해지게 되었습니다. 프로그래밍 언어로서 데이터를 다루고 분석하는 것은 R이 더 쉽지만, 처리 속도측면이나 최근 동향은 python으로 많이 치우쳐 지는 것을 알 수가 있습니다. python의 빠른 처리 속도를 장점으로 python에서도 R과 비슷하게 데이터 전 처리를 쉽게 하기위해서 나온 모듈이 pandas입니다. 그리고 R과 비슷하게 데이터프레임같은 형태를 다룰 수 있게 하는 모듈이 numpy입니다. 그밖에 scikit-learn,keras,ma.. 2020. 7. 13.
[R] Machine learning (3) - Support vector machine (SVR, part2) 오늘은 어제에 내용인 Support vector machine (classification)에 이어서 분석해보도록 하겠습니다. 데이터셑 만드는 것은 이전 포스팅을 참고하시고 코드만 적어놓겠습니다. ※ 윈도우로 진행해보니까 많이 딜레이되네요. 데이터를 조금 줄여서 진행해보겠습니다. https://mopipe.tistory.com/38 Machine learning (2) - Support vector machine (SVM, part 1) 오늘은 Support vector machine (SVM)에 대해서 이야기해보려고 합니다! SVM은 Machine learning methods중에서 쓸만한 방법중 하나라고 생각합니다.! (SVM이 최고라능~!) 어떤 데이터를 넣어도 중간 이상은 하는.. mopipe.t.. 2020. 7. 10.
[R] Machine learning (2) - Support vector machine (SVM, part 1) 오늘은 Support vector machine (SVM)에 대해서 이야기해보려고 합니다! SVM은 Machine learning methods중에서 쓸만한 방법중 하나라고 생각합니다.! (SVM이 최고라능~!) 어떤 데이터를 넣어도 중간 이상은 하는 방법! 이라고 생각합니다. 오늘도 데이터셑은 ggplot2에 있는 diamonds를 이용할 것입니다. 데이터셑 불러오거나 관련된 설명은 Linear regression 포스팅 앞부분을 참고해주세요! mopipe.tistory.com/37 Machine learning (1) - Linear regression machine learning에서 가장 기본적인 linear regression에 대해 포스팅하려고 합니다. 포스팅해야할 주제는 많은데 정리가 잘 안.. 2020. 7. 9.