GWAS는 분석 방법은 거의 20년이 다 되어가고 있습니다. (2002년 Ozaki 그룹에서 처음 논문이 나옴)
초창기 분석에는 샘플의 개수에 상관없이 많은 연구들이 쏟아져 나오게 되었습니다.
그러다가 p-value에 대한 cutoff (pvalue = 5e-10이하의 값을 갖는 변이만 인정)가 생기고, 샘플 개수를 이용한 statistic power를 계산하는 방법까지 많은 다양한 기준들이 생겨났습니다.
저도 박사과정 중에 GWAS분석을 여러번 해보았고, 주변사람들 분석을 할때 꽤 도와준 적이 있습니다.
분석 실패도 여러번 맛 보았고, 주변사람들 분석을 도와줄 때도 항상 걸렸던 요인이 있습니다.
바로 Statistical Power 입니다. (쉽게 이야기하면 샘플수가 문제입니다.)
어떠한 질병을 분석을 할 때, 고려해야할 것은 많습니다. Prevalence(유병률), Disease Allele Frequency, 질병에 주요 유전자가 있느냐 혹은 다수의 유전자가 있느냐에 따라 분석방법(양적형질이냐 질적형질이냐에 따라 방법이 나눔)이 다양하게 고려가 됩니다.
이 중에서 Statistical Power는 질병분석이 통계적으로 잘 진행되어 있는지를 알 수가 있고, 연구를 진행을 할때 샘플들의 수를 대략적으로 알려줍니다.
Statistical power를 알려주는 프로그램도 있는데, Quanto라는 프로그램으로 윈도우기반의 프로그램입니다. 그런데 이건 현재 다운을 받을 수가 없는 것 같습니다. (유지 보수가 안되서 닫아버린 것 같습니다.)
그렇기 때문에 Statistical power를 계산할수있는 사이트를 소개해드리려고 합니다.
csg.sph.umich.edu/abecasis/gas_power_calculator/
미시간 대학에서 만든 사이트인데 나중에 설명드릴 Imputation tool도 이 미시간에서 만들었습니다.
위 사이트를 들어가게되면 다음과 같이 나옵니다.
넣을 수 있는 값들을 넣어주시고, 그래프에서 어떤 것을 볼지 선택을 하면 case, control이 몇 개가 적당한지 또는 p-value가 얼마가 적당한지를 알 수가 있습니다.
prevalence, disease model, disease allele frequency는 대부분 인터넷 혹은 전문가를 통해 정보를 얻어야 합니다.
Statistical power는 대부분 0.8이상으로 잡으시면 됩니다.
결과값을 보았을 때, Expected power for a one-stage study에 값이 0.8이상은 되어야 괜찮은 분석이다 라고 생각하시면 됩니다.
더 자세한 내용은 추후에 올리도록 하겠습니다.
유용하셨거나, 잘 보셧다면 주변 광고 한번씩만 클릭 부탁드립니다! 감사합니다!
'유전체 > GWAS' 카테고리의 다른 글
[GWAS] 데이터 QC하는 방법 (hardy-weinberg, missing genotype, etc) (0) | 2020.12.11 |
---|---|
[GWAS] 교육과 질병과의 관계 (0) | 2020.12.01 |
[GWAS] plink에 유용한 기능 (3) (filter-case,controls,males, etc) (0) | 2020.06.22 |
[GWAS] GWAS Quality Control (QC) (4) | 2020.06.19 |
[GWAS] GWAS 분석시 참고하기 좋은 사이트들 (0) | 2020.06.14 |
댓글