mind2 [GWAS] 데이터 QC하는 방법 (hardy-weinberg, missing genotype, etc) plink를 이용한 본격적인 분석 이전에 데이터를 QC하는 방법에 대해서 설명하고자 합니다. genotype QC에는 7가지로 나눌수가 있습니다. Missingness of SNPs and Individuals Sex discrepancy Minor allele frequency Hardy-weinberg equilibrium Heterozygosity Relatedness Population stratification 이렇게 나누어 질 수가 있습니다. 1. Missingness of SNPs and individuals plink에서 --geno, --mind를 이용하여 QC가 가능합니다. --geno : genotype의 missing 비율에 따라 genotype marker를 제거하는 기능입니다. .. 2020. 12. 11. [GWAS] GWAS Quality Control (QC) GWAS를 진행함에 있어서 가장 중요한 것은 크기를 줄이는 것과 정확한 변이를 분석하는 것입니다. 1 . 대부분의 GWAS는 수백만개의 변이에서부터 수십개정도의 변이를 이용하여 분석함. 2. 분석할 때 population크기가 적당한 크기가 되어야함 (Statistics power를 확인해보시면됩니다.) 3. 그냥 바로 분석하기에는 1종오류, 2종오류가 많음. plink에는 여러 QC 방법들이 있음. 1. --hwe [pvalue] (hardy-Weinberg equilibrium) QC 설명이 늦었던 이유가 이 하디 법칙을 찾아보느라 늦었습니다. (pvalue구하는 것까지 구해보려했으나, plink pvalue같이는 못만들겠네요. 아시는분 저좀 알려주세요~~) 하디 법칙의 pvalue로 variants.. 2020. 6. 19. 이전 1 다음