본문 바로가기
유전체/GWAS

[GWAS] 결과 분석하는 방법 (assoc function)

by 인포메틱스 2021. 2. 1.
반응형

실습용 데이터는 Gilles, Annick, et al. "A pilot genome-wide association study identifies potential metabolic pathways involved in tinnitus." Frontiers in neuroscience 11 (2017): 71. 을 이용하였습니다.

 

 결과 분석을 간단하게 알려드리기 위해서 포스팅합니다.

 

plink를 돌리게 되면 주로 결과는 MAF를 이용하여 확인하게 됩니다.

  질병군
정상군   Minor Allele Frequency Major Allele Frequency
Minor Allele Frequency 일반 변이일 가능성이 농후 질병변이의 가능성 농후
Major Allele Frequency 일반 변이일 가능성이 농후 일반 변이일 가능성이 농후

 

먼저 분석을 돌리면 변이에서 Minor Allele Frequency를 확인합니다. 그리고 정상군 질병군간에 AF를 이용하여 chi-test 결과를 내서 p-value를 얻는 것입니다.

 

그렇기 때문에 결과를 간단하게 해석하자면 (assoc기준으로 분석하겠습니다.)

 

Header name mean
CHR chromosome
SNP information (bim file 2번째 column에 따라 변경됨)
POS chromosome 위치
A1 Minor Allele Frequency (MAF)
F_A Case에서 MAF 변이의 AF (Case에서 A1의 빈도)
F_U Control에서 MAF변이의 AF (Control에서 A1의 빈도)
A2 Major Allele Frequency
CHISQ Chi-test 값
P Chi-test pvalue
OR Odd ratio

 

해당 MAF의 경우 다른 Study의 정상군과 비교를 해서 정확한 결과인지 확인해야 합니다.

 

다른 Study라고 함은 ExAC, gnomAD 데이터를 말합니다. 그리고 LD를 확인해서 질병과 관련된 변이를 찾아서 연관시킬수도 있구요. ( 우리나라 데이터에서 LD를 연관시키기에는 우리나라 LD에 관련 연구가 아직 되어있는 것이 없어 공격당할 확률이 있습니다.)

 

그리고 plink의 단점중 하나는 결과가 뭔가 tsv파일인것 처럼 보이지만 실제로는 그렇지가 않습니다. (정말 화나는 점)

 

그렇기 때문에 python을 이용하거나 shell script를 이용하여 tsv로 변경후 분석하셔야합니다.

 

여기까지가 GWAS 분석결과를 해석하는 일부를 설명드렸습니다.

 

 


mopipe.tistory.com/106

 

MAF란? (Minor Allele Frequency)

모든 Bio관련 분석은 특정 변이를 기반으로 분석하기 때문에 변이와 연관된 단어인 MAF는 Bioinformatics를 하면서 가장 많이 보게 되는 단어일 수 있습니다. 위키에 MAF는 다음과 같이 이야기하고 있

mopipe.tistory.com

 

MAF에 대한 설명은 다음을 참고하세요!

 


 

연습문제 다운링크 남깁니다(논문에 나오는 링크 접근이 안되고 있더라구요.)

https://drive.google.com/file/d/1AA2D1VseBNzSXnzSgCg5WPCATV_zmzSR/view?usp=sharing 

 

tinnitus.zip

 

drive.google.com

 

728x90
반응형

댓글