MDS plot2 [GWAS] 데이터 QC하는 방법 (hardy-weinberg, missing genotype, etc) plink를 이용한 본격적인 분석 이전에 데이터를 QC하는 방법에 대해서 설명하고자 합니다. genotype QC에는 7가지로 나눌수가 있습니다. Missingness of SNPs and Individuals Sex discrepancy Minor allele frequency Hardy-weinberg equilibrium Heterozygosity Relatedness Population stratification 이렇게 나누어 질 수가 있습니다. 1. Missingness of SNPs and individuals plink에서 --geno, --mind를 이용하여 QC가 가능합니다. --geno : genotype의 missing 비율에 따라 genotype marker를 제거하는 기능입니다. .. 2020. 12. 11. [R] 차원축소 PCA, PCoA (MDS) 실습 데이터 유사도! Multidimensional scaling 일명 MDS plot이라고도 하는 그림을 분석하다가 가끔 봅니다. Array Genotyping QC에서도 보고, GWAS QC과정에서도 보고 여러군데에서 많이 볼수 있는 그림인데, 샘플들끼리의 유사도를 확인하는데 주로 많이 사용하는 것 같습니다. (RNA edge R에서의 MDS plot도 같은 방법임) MDS에는 여러 방법들이 있지만, 주로 많이 사용되는 방법은 Principle coordinates Analysis (PCoA, Classical multidimensional scaling) 인데, 영어 풀네임을 보면 뭔가 비슷한 개념이 생각이 날 수가 있는데, 바로 principle component analysis (PCA)입니다. ! MDS 다른 방법.. 2020. 12. 5. 이전 1 다음