본문 바로가기

classification2

[유사도측정, 데이터분석] 유사도 측정의 중요성 최근 빠져있는 주제가 있습니다. 바로 유사도 입니다. 빠져있기 보다는 데이터 분석에서 항상 중요하다고 생각되는 부분이라고 말하고 싶습니다. 대부분의 Deep learning 모델에서 이런 유사도를 이용하여 분석이 이루어지기도 합니다. 앞으로 포스팅은 이 유사도 방법에 대한 개념들을 몇가지 포스팅 하고자 합니다. 1. 유사도란? 유사도는 다양하게 이용할 수가 있는데, 주로 classification에 이용된다고 생각합니다. 어떠한 데이터가 들어왔을 때, 이 데이터를 판별하기 위하여 사람들은 유사도를 이용합니다. 아주 유명한 짤이 머핀과 치와와 짤입니다. 유사도의 특징은 주로 0~1사이의 값을 갖고, 0로 갈수록 매우 낮은 유사성을 갖고, 1로 갈수록 높은 유사성을 갖습니다. 치와와 머핀 이외의 간단한 예시.. 2022. 12. 2.
[R] Machine learning (2) - Support vector machine (SVM, part 1) 오늘은 Support vector machine (SVM)에 대해서 이야기해보려고 합니다! SVM은 Machine learning methods중에서 쓸만한 방법중 하나라고 생각합니다.! (SVM이 최고라능~!) 어떤 데이터를 넣어도 중간 이상은 하는 방법! 이라고 생각합니다. 오늘도 데이터셑은 ggplot2에 있는 diamonds를 이용할 것입니다. 데이터셑 불러오거나 관련된 설명은 Linear regression 포스팅 앞부분을 참고해주세요! mopipe.tistory.com/37 Machine learning (1) - Linear regression machine learning에서 가장 기본적인 linear regression에 대해 포스팅하려고 합니다. 포스팅해야할 주제는 많은데 정리가 잘 안.. 2020. 7. 9.