본문 바로가기

약물11

[약물] 약물의 유사도 확인하기, ECFP 실습, R package이용 이전에 포스팅하였던 내용인 약물의 ECFP를 계산하고 tanimoto coefficient 유사도를 찾는 실습을 해보고자 합니다. R을 이용한 분석이고 추후에 python에 대한 분석도 올릴 예정입니다. 패키지로는 Rcpi, rcdk package를 이용하겠습니다. 최근 ChemmineR package가 나오긴 했지만, 주로 많이 사용하는 package를 사용하도록 하겠습니다. (ChemmineR에는 ECFP 계산하는게 없는것 같네요..) 참고로 rcdk는 install.packages 를 이용하면되고, Rcpi의 경우 Bioconductor를 이용(BiocManager::install)해서 설치를 해야합니다. 그리고 주의점은 rcdk, Rcpi의 경우 뭔가 설치하는데 예민한것 같습니다.(설치가 쉽지가 .. 2020. 12. 10.
[약물] chemical fingerprint, ECFP (Extened Connectivity FingerPrint) - drug repositioning, drug discovery 오늘 포스팅할 내용은 ECFP라는 개념에 대해서 설명하고자 합니다. 먼저 알아둬야할 개념은 fingerprint인데, fingerprint란? 무엇일까요? 영어 사전에 찾아보면 "지문"이라고 나옵니다. 지문의 가장 큰 특징은 사람마다 다르다는 특징이 있습니다. 사람마다 다르기 때문에 최근에는 휴대폰의 잠금해체에도 이용되고 있죠. 사람들마다 지문이 같을 확률은 10억분의 1정도라고 합니다. (네이버 지식인에서 급하게 찾아왔어요!ㅎㅎ) 이처럼 fingerprint의 뜻은 지문이기도 하지만 비슷하게 여러 뜻(digital fingerprint (전자 개인정보), genetic fingerprint (유전자 지문) 등)으로도 사용이 됩니다. 그렇다면 Chemical에서의 fingerprint는?! 무슨 뜻일까요.. 2020. 12. 9.
약물의 유사도를 구해보자! (tanimoto, jaccard, fmscR) 약물은 각자의 Target에 작용하는 작용기들이 있습니다. 그렇기 때문에 사람들은 유사한 약물일수록 비슷한 기능을 할거다 라고 생각을 하게 됩니다. (실제로도 그러는 경우가 있죠. 예를 들어 탈모약들!) 그래서 약물의 유사도를 측정을 하게 되는데 주로 많이 사용되는 방법중 하나가 tanimoto coefficient입니다. (사실 tanimoto밖에 안배웠어요... 다른 방법도 아시면 아래 댓글남겨주세요) jaccard similarity라고도 하는 tanimoto 방식은 많은 곳에서 사용이 되고 있습니다. 예를들어 이미지분석에서 많이 사용이 되는 것으로 알려져있습니다. tanimoto coefficient의 식은 다음과 같습니다. 화합물에 유사도를 얻기 위해서는 유사도의 기준이 있어야겠죠 . 이 기준은.. 2020. 8. 12.
화합물 파일 구조 (mol, sdf file 구조) drug screening이란 약물 테스트라고 생각하면됩니다. 소변안에 drug screening한다는 것은 뽕쟁이를 찾는다는 말이기도 합니다. 그런데 여기서 말하고 싶은 drug screening이란 새로운 약물을 찾는 것입니다. 그러기 위해서는 화합물들의 정보를 컴퓨터로 불러와서 분석을 진행해야하는데 화합물들의 정보 (원소의 위치, 분자량의 정보 등등)들은 mol, sdf file format으로 저장되어집니다. 오늘은 이 mol, sdf file format에 대해 간단하게 알아보도록 하겠습니다. 두둥탁! mol file은 아주 기본적인 화합물 format으로 안에 정보에는 많은 정보들을 포함하고 있는데 1. 원소들의 x-y-z좌표 정보들을 포함하고 있습니다. 2. bond 결합의 정보 3. 화합물.. 2020. 8. 12.
약물연구관련 사이트 첫 포스팅에서는 약물 연구에사용되는 데이터베이스들을 소개하려고합니다. 우리 정보학하는 사람들이 중요해진 이유는 최근 10~20년동안 사람들이 데이터생성만 미친듯이 해서 데이터들이 많이 쌓이게 되죠. (앞으로도 쌓일겁니다.) 그래서 이러한 데이터들을 효율적으로 정리하고, 새로운 결과를 내는 것이 중요하게 되었기 때문입니다. 저는 정보학하는 사람들을 하이에나 라고 생각합니다. 하이에나 하면 비열하고 더럽다. 라는 인식이 강하겠지만 여기저기 다니면서 부패한 고기들을 정리하는 역활을 하기 때문에 생태계순환에 비중있는 역활을 하게됩니다. 부패한 고기처리에 어느정도 일조하는거죠. 앞으로도 정보학하는 사람들을 필요하게 될 것이고, 회사에 한사람 정도는 필수적으로 있어야할 직업일 것 같습니다. (회사에 모아둔 자료정리.. 2020. 8. 6.