본문 바로가기
약물

화합물 파일 구조 (mol, sdf file 구조)

by 인포메틱스 2020. 8. 12.
반응형

drug screening이란 약물 테스트라고 생각하면됩니다.

 

소변안에 drug screening한다는 것은 뽕쟁이를 찾는다는 말이기도 합니다.

 

그런데 여기서 말하고 싶은 drug screening이란 새로운 약물을 찾는 것입니다.

 

그러기 위해서는 화합물들의 정보를 컴퓨터로 불러와서 분석을 진행해야하는데

 

화합물들의 정보 (원소의 위치, 분자량의 정보 등등)들은 mol, sdf file format으로 저장되어집니다.

 

오늘은 이 mol, sdf file format에 대해 간단하게 알아보도록 하겠습니다.

 

두둥탁!

 

sdf file format의 윗쪽을 캡쳐해보았습니다.

 

mol file은 아주 기본적인 화합물 format으로 안에 정보에는 많은 정보들을 포함하고 있는데

 

1. 원소들의 x-y-z좌표 정보들을 포함하고 있습니다.

2. bond 결합의 정보

3. 화합물의 이름

 

mol file과 비슷한 sdf파일의 경우 mol file에서 추가적인 정보가 들어있습니다.

 

1. 분자량

2. Unique ID

3. 기타 정보 (Vendor, SMILES)

 

sdf파일 안에는 다수의 화합물을 넣을 수가 있는데, "$$$$" 이러한 표시를 기준으로 화합물이 나누어집니다.

sdf file에서는 SMilJCHEM_IUPAC, SMILES 라는 것들이 있는데 이것들도 모두 화합물을 나타내는 표현식입니다.

 

이렇게 sdf, mol파일들의 format을 포스팅한 이유는 (내용도 뭣도 없구만! 이라고 생각할 수가 있죠.)

 

 다음 포스팅에서는 화합물사이에 유사도를 구하는 방법을 구해보려고 간단하게 설명을 한 것입니다.

 

사실 위에 sdf,mol파일들을 다루는 사람들은 대부분 안에 있는 내용을 다루기 보다는 어떤 프로그램을 이용하여 사용 하는 경우가 대부분이기 때문에 그냥 sdf,mol파일에 이런 정보들이 있다 정도로만 알고있으면 될것 같습니다.

 

728x90
반응형

댓글