실습용 데이터는 Gilles, Annick, et al. "A pilot genome-wide association study identifies potential metabolic pathways involved in tinnitus." Frontiers in neuroscience 11 (2017): 71. 을 이용하였습니다.
결과 분석을 간단하게 알려드리기 위해서 포스팅합니다.
plink를 돌리게 되면 주로 결과는 MAF를 이용하여 확인하게 됩니다.
질병군 | |||
정상군 | Minor Allele Frequency | Major Allele Frequency | |
Minor Allele Frequency | 일반 변이일 가능성이 농후 | 질병변이의 가능성 농후 | |
Major Allele Frequency | 일반 변이일 가능성이 농후 | 일반 변이일 가능성이 농후 |
먼저 분석을 돌리면 변이에서 Minor Allele Frequency를 확인합니다. 그리고 정상군 질병군간에 AF를 이용하여 chi-test 결과를 내서 p-value를 얻는 것입니다.
그렇기 때문에 결과를 간단하게 해석하자면 (assoc기준으로 분석하겠습니다.)
Header name | mean |
CHR | chromosome |
SNP | information (bim file 2번째 column에 따라 변경됨) |
POS | chromosome 위치 |
A1 | Minor Allele Frequency (MAF) |
F_A | Case에서 MAF 변이의 AF (Case에서 A1의 빈도) |
F_U | Control에서 MAF변이의 AF (Control에서 A1의 빈도) |
A2 | Major Allele Frequency |
CHISQ | Chi-test 값 |
P | Chi-test pvalue |
OR | Odd ratio |
해당 MAF의 경우 다른 Study의 정상군과 비교를 해서 정확한 결과인지 확인해야 합니다.
다른 Study라고 함은 ExAC, gnomAD 데이터를 말합니다. 그리고 LD를 확인해서 질병과 관련된 변이를 찾아서 연관시킬수도 있구요. ( 우리나라 데이터에서 LD를 연관시키기에는 우리나라 LD에 관련 연구가 아직 되어있는 것이 없어 공격당할 확률이 있습니다.)
그리고 plink의 단점중 하나는 결과가 뭔가 tsv파일인것 처럼 보이지만 실제로는 그렇지가 않습니다. (정말 화나는 점)
그렇기 때문에 python을 이용하거나 shell script를 이용하여 tsv로 변경후 분석하셔야합니다.
여기까지가 GWAS 분석결과를 해석하는 일부를 설명드렸습니다.
MAF에 대한 설명은 다음을 참고하세요!
연습문제 다운링크 남깁니다(논문에 나오는 링크 접근이 안되고 있더라구요.)
https://drive.google.com/file/d/1AA2D1VseBNzSXnzSgCg5WPCATV_zmzSR/view?usp=sharing
'유전체 > GWAS' 카테고리의 다른 글
[R,GWAS] 카이검정 (chisq.test), 피셔검정(fisher.test) 쉽게 하기 (0) | 2021.03.09 |
---|---|
[GWAS] Imputation 시에 중복된 변이의 경우에는? (0) | 2021.03.03 |
[GWAS] Genotyping microarray 분석 시 주의해야할 concordance rate (1) | 2020.12.30 |
[GWAS] 데이터 QC하는 방법 (hardy-weinberg, missing genotype, etc) (0) | 2020.12.11 |
[GWAS] 교육과 질병과의 관계 (0) | 2020.12.01 |
댓글