본문 바로가기
유전체/GWAS

[GWAS] Plink 유용한 기능 (2) (freq, hardy)

by 인포메틱스 2020. 6. 10.
반응형

어제 포스팅에 이어서 오늘도 Plink 에서 유용한 기능 두번째!!

 

plink를 이용해서 기본적인 통계기능들을 살펴보도록 하겠습니다.

 

일단 연습 문제를 만들기위해서!

test_set.fam
test_set.bim 999개 변이

 

다음과 같이 테스트 샘플을 만듭니다.

 

Raw data = 이전 포스팅했던 이명관련 open data를 이용하였습니다.

 

파이썬이나 기타 방법으로 테스트 샘플을 만드시던지 아니면 raw data를 이용하세요! (그런데 오래걸릴 수 있습니다.)

 

 


1 . --freq[x]

 분석을 진행할때,

 

plink --bfile test_set --freqx --out freqx

output : freqx.frqx

내용 : A1 , A2에 대해서 Homo, Hetero빈도수 확인이 가능합니다.

freqx.frqx

 

plink --bfile test_set --freq --out freq

output : freq.frq

내용 : A1에 대한 AF (MAF)가 나오게 됩니다.

freq.frq

추가적으로  Case control을 지정을 하셧다면 (fam,map파일에서) case control에 대한 MAF확인도 가능합니다.

plink --bfile test_set --freq case-control --out freq1 --allow-no-sex

output : freq1.frq.cc

내용 : case control 따로따로 MAF가 나옵니다. (Minor Allele는 1개 A1을 기준으로, A1이 plink에서는 minor allele입니다.)

freq1.frq.cc

 

2. --hardy

 

GWAS 주요 QC방법중 하나인 Hardy

 

plink --bfile test_set --hardy --out hardy --allow-no-sex

output : hardy.hwe

내용 : Hardy-weinberg equilibrium에 대한 pvalue값을 줍니다. 

 

hardy.hwe

 

QC중에 Hardy로 cutoff 가 되지만, 그래도 잘되었는지 확인하기 위해서는 --hardy를 이용하시면됩니다.

 

 

 


오늘은 너무 늦게 글을 쓰느라, 내용도 조금 부실하게 준비를 했네요..

 

다음 포스팅도 plink에서 유용한 기능들에 대해 좀 더 알아보도록 하겠습니다.!!

728x90
반응형

댓글