본문 바로가기

drug8

[약물] ECFP fingerprints 간단한 정리 약물의 fingerprint 중에 topological fingerprint는 약물의 유사도나 substructure 를 검색하기 위하여 개발이 되었습니다. 그중에서 많이 사용하는 방법중 하나가 바로 ECFP입니다. 약물의 유사도의 경우 설명을 하지 않아도 우리가 비슷한 약물이 비슷한 짓을 할것이다 라고 생각하기 때문에 유사성을 보려는 시도를 예전부터 많이 하였습니다. ECFP는 2010년에 Rogers, David, and Mathew Hahn. "Extended-connectivity fingerprints." Journal of chemical information and modeling 50.5 (2010): 742-754. 라는 논문에서 처음 나왔습니다. 논문에서 나온 ECFP 만드는 과정은 다.. 2021. 3. 24.
[R] rcdk설치시 오류 해결방법 환경은 다음과 같습니다. version : Ubuntu 20.04 1LTS R version : 4.0.3 rcdk를 이용하기 위해서 설치를 하니 다음과 같은 오류가 떳습니다. configure: error: One or more Java configuration variables are not set. Make sure R is configured with full Java support (including JDK). Run R CMD javareconf as root to add Java support to R. If you don't have root privileges, run R CMD javareconf -e to set all Java-related variables and then inst.. 2021. 1. 29.
[약물] 약물의 유사도 확인하기, ECFP 실습, R package이용 이전에 포스팅하였던 내용인 약물의 ECFP를 계산하고 tanimoto coefficient 유사도를 찾는 실습을 해보고자 합니다. R을 이용한 분석이고 추후에 python에 대한 분석도 올릴 예정입니다. 패키지로는 Rcpi, rcdk package를 이용하겠습니다. 최근 ChemmineR package가 나오긴 했지만, 주로 많이 사용하는 package를 사용하도록 하겠습니다. (ChemmineR에는 ECFP 계산하는게 없는것 같네요..) 참고로 rcdk는 install.packages 를 이용하면되고, Rcpi의 경우 Bioconductor를 이용(BiocManager::install)해서 설치를 해야합니다. 그리고 주의점은 rcdk, Rcpi의 경우 뭔가 설치하는데 예민한것 같습니다.(설치가 쉽지가 .. 2020. 12. 10.
[R] KEGGREST package KEGG는 일본에서 만든 pathway관련 데이터 베이스입니다. www.genome.jp/kegg/ KEGG: Kyoto Encyclopedia of Genes and Genomes www.genome.jp 위 사이트를 가시게 되면 연구되고 있고, 알려져 있는 대부분의 pathway를 잘 정리를 해놓았습니다. pathway에 대해 모르시는 분들도 있을 것 같아. 간단하게 설명을 하면 생물체는 공장이라고 생각하시면 됩니다. 어떤 공장이든 특정 부분을 담당하는 기계 혹은 사람들이 있습니다. 그들 자체를 pathway라고 생각하시면 됩니다. 반복되는 일을 특정 사람, 기계가 하는 것이죠. 그리고 일이 시작되는 앞 혹은 뒤에서 일을 멈추거나 밀리게 되면, 알아서 쉬거나 혹은 다른 일을 찾는 일까지 가능하죠. 이.. 2020. 10. 6.
약물의 유사도를 구해보자! (tanimoto, jaccard, fmscR) 약물은 각자의 Target에 작용하는 작용기들이 있습니다. 그렇기 때문에 사람들은 유사한 약물일수록 비슷한 기능을 할거다 라고 생각을 하게 됩니다. (실제로도 그러는 경우가 있죠. 예를 들어 탈모약들!) 그래서 약물의 유사도를 측정을 하게 되는데 주로 많이 사용되는 방법중 하나가 tanimoto coefficient입니다. (사실 tanimoto밖에 안배웠어요... 다른 방법도 아시면 아래 댓글남겨주세요) jaccard similarity라고도 하는 tanimoto 방식은 많은 곳에서 사용이 되고 있습니다. 예를들어 이미지분석에서 많이 사용이 되는 것으로 알려져있습니다. tanimoto coefficient의 식은 다음과 같습니다. 화합물에 유사도를 얻기 위해서는 유사도의 기준이 있어야겠죠 . 이 기준은.. 2020. 8. 12.
화합물 파일 구조 (mol, sdf file 구조) drug screening이란 약물 테스트라고 생각하면됩니다. 소변안에 drug screening한다는 것은 뽕쟁이를 찾는다는 말이기도 합니다. 그런데 여기서 말하고 싶은 drug screening이란 새로운 약물을 찾는 것입니다. 그러기 위해서는 화합물들의 정보를 컴퓨터로 불러와서 분석을 진행해야하는데 화합물들의 정보 (원소의 위치, 분자량의 정보 등등)들은 mol, sdf file format으로 저장되어집니다. 오늘은 이 mol, sdf file format에 대해 간단하게 알아보도록 하겠습니다. 두둥탁! mol file은 아주 기본적인 화합물 format으로 안에 정보에는 많은 정보들을 포함하고 있는데 1. 원소들의 x-y-z좌표 정보들을 포함하고 있습니다. 2. bond 결합의 정보 3. 화합물.. 2020. 8. 12.