본문 바로가기
유전체/GWAS

[GWAS] GWAS 하기 위한 필수 요건!

by 인포메틱스 2020. 7. 24.
반응형

 

GWAS는 분석 방법은 거의 20년이 다 되어가고 있습니다. (2002년 Ozaki 그룹에서 처음 논문이 나옴)

 

초창기 분석에는 샘플의 개수에 상관없이 많은 연구들이 쏟아져 나오게 되었습니다.

 

그러다가 p-value에 대한 cutoff (pvalue = 5e-10이하의 값을 갖는 변이만 인정)가 생기고, 샘플 개수를 이용한 statistic power를 계산하는 방법까지 많은 다양한 기준들이 생겨났습니다.

 

저도 박사과정 중에 GWAS분석을 여러번 해보았고, 주변사람들 분석을 할때 꽤 도와준 적이 있습니다.

 

 분석 실패도 여러번 맛 보았고, 주변사람들 분석을 도와줄 때도 항상 걸렸던 요인이 있습니다.

 

바로 Statistical Power 입니다. (쉽게 이야기하면 샘플수가 문제입니다.)

 

어떠한 질병을 분석을 할 때, 고려해야할 것은 많습니다. Prevalence(유병률), Disease Allele Frequency, 질병에 주요 유전자가 있느냐 혹은 다수의 유전자가 있느냐에 따라 분석방법(양적형질이냐 질적형질이냐에 따라 방법이 나눔)이 다양하게 고려가 됩니다.

 

이 중에서 Statistical Power는 질병분석이 통계적으로 잘 진행되어 있는지를 알 수가 있고, 연구를 진행을 할때 샘플들의 수를 대략적으로 알려줍니다.

 

Statistical power를 알려주는 프로그램도 있는데, Quanto라는 프로그램으로 윈도우기반의 프로그램입니다. 그런데 이건 현재 다운을 받을 수가 없는 것 같습니다. (유지 보수가 안되서 닫아버린 것 같습니다.)

 

그렇기 때문에 Statistical power를 계산할수있는 사이트를 소개해드리려고 합니다.

 

csg.sph.umich.edu/abecasis/gas_power_calculator/

 

Home | GAS Power Calculator

Statistical Power vs. Cases Controls Cases + Controls Significance level Prevalence Disease Allele Frequency Genotype Relative Risk

csg.sph.umich.edu

 

미시간 대학에서 만든 사이트인데 나중에 설명드릴 Imputation tool도 이 미시간에서 만들었습니다.

 

위 사이트를 들어가게되면 다음과 같이 나옵니다.

 

 

넣을 수 있는 값들을 넣어주시고, 그래프에서 어떤 것을 볼지 선택을 하면 case, control이 몇 개가 적당한지 또는 p-value가 얼마가 적당한지를 알 수가 있습니다.

 

prevalence, disease model, disease allele frequency는 대부분 인터넷 혹은 전문가를 통해 정보를 얻어야 합니다.

 

Statistical power는 대부분 0.8이상으로 잡으시면 됩니다. 

 

결과값을 보았을 때, Expected power for a one-stage study에 값이 0.8이상은 되어야 괜찮은 분석이다 라고 생각하시면 됩니다.

 

더 자세한 내용은 추후에 올리도록 하겠습니다.

 

 


유용하셨거나, 잘 보셧다면 주변 광고 한번씩만 클릭 부탁드립니다! 감사합니다!

728x90
반응형

댓글