본문 바로가기
약물

약물의 유사도를 구해보자! (tanimoto, jaccard, fmscR)

by 인포메틱스 2020. 8. 12.
반응형

 

약물은 각자의 Target에 작용하는 작용기들이 있습니다. 

 

그렇기 때문에 사람들은 유사한 약물일수록 비슷한 기능을 할거다 라고 생각을 하게 됩니다.

(실제로도 그러는 경우가 있죠. 예를 들어 탈모약들!)

 

그래서 약물의 유사도를 측정을 하게 되는데 주로 많이 사용되는 방법중 하나가 tanimoto coefficient입니다.

(사실 tanimoto밖에 안배웠어요... 다른 방법도 아시면 아래 댓글남겨주세요)

 

jaccard similarity라고도 하는 tanimoto 방식은 많은 곳에서 사용이 되고 있습니다.

 

예를들어 이미지분석에서 많이 사용이 되는 것으로 알려져있습니다.

 

tanimoto coefficient의 식은 다음과 같습니다.

 

출처: wikipebia jaccard index

 화합물에 유사도를 얻기 위해서는 유사도의 기준이 있어야겠죠 .

 

이 기준은 작용기가 될수가 있고, 중요 구조가 될 수가 있습니다.

 

그러나 이번에 알려들 방법은 Maximum Common Substructure (MCS)라는 방식으로 제가 이해한 내용은 원소간의 결합을 기준으로 유사도를 구해내는 것 같습니다.

 

아무튼 이런 MCS방식을 이용하여 tanimoto coefficient를 구하게 되면 유사도가 나오게 되고, 0~1사이의 값이 나오게 됩니다. 당연히 1로 갈수록 같은 화합물이라고 생각하면 되겠죠!

 

오늘은 여기까지 포스팅을 진행하도록 하겠고, 다음은 실습을 해보도록 하겠습니다.

 

다음 시간에는 KEGGREST, ChemmineR, fmcsR 이렇게 세개의 R package를 이용해서

 

tanimoto coefficient를 구하는 방법에 대해서 포스팅을 해보고자 합니다.

 


지금 포스팅하고 있는 내용들은 제가 공부를 진행하면서 정리한 내용들을 올려놓은 것입니다.

 

모르는부분 혹은 이상한부분있으시면 댓글에다 연락주세요!


 

유용하셨거나, 잘 보셧다면 주변 광고 한번씩만 클릭 부탁드립니다! 감사합니다!

728x90
반응형

댓글