hardy-weinberg2 [GWAS] 데이터 QC하는 방법 (hardy-weinberg, missing genotype, etc) plink를 이용한 본격적인 분석 이전에 데이터를 QC하는 방법에 대해서 설명하고자 합니다. genotype QC에는 7가지로 나눌수가 있습니다. Missingness of SNPs and Individuals Sex discrepancy Minor allele frequency Hardy-weinberg equilibrium Heterozygosity Relatedness Population stratification 이렇게 나누어 질 수가 있습니다. 1. Missingness of SNPs and individuals plink에서 --geno, --mind를 이용하여 QC가 가능합니다. --geno : genotype의 missing 비율에 따라 genotype marker를 제거하는 기능입니다. .. 2020. 12. 11. [GWAS] Plink 유용한 기능 (2) (freq, hardy) 어제 포스팅에 이어서 오늘도 Plink 에서 유용한 기능 두번째!! plink를 이용해서 기본적인 통계기능들을 살펴보도록 하겠습니다. 일단 연습 문제를 만들기위해서! 다음과 같이 테스트 샘플을 만듭니다. Raw data = 이전 포스팅했던 이명관련 open data를 이용하였습니다. 파이썬이나 기타 방법으로 테스트 샘플을 만드시던지 아니면 raw data를 이용하세요! (그런데 오래걸릴 수 있습니다.) 1 . --freq[x] 분석을 진행할때, plink --bfile test_set --freqx --out freqx output : freqx.frqx 내용 : A1 , A2에 대해서 Homo, Hetero빈도수 확인이 가능합니다. plink --bfile test_set --freq --out fre.. 2020. 6. 10. 이전 1 다음