반응형
한국인 칩을 분석을 하면서 가끔 무언가를 샘플 그룹을 나누고 합치고 하다보면 중복되는 변이가 있는 것을 발견합니다.
이럴때는 plink에서는 어떻게 처리를 할까요?
예전 분석을 할때, 위와 같은 경우가 발생하여 --freqx라는 기능으로 각 변이의 frequence를 확인해보니 무조건 변이가 있는 경우는 Case 없는 경우는 Control로 잡습니다. (두 변이다 frequency의 총합은 같구요)
그리고 조금 더 보니 Imputation을 진행하다보면 같은 위치에서도 같은 샘플에서 다른 변이를 갖고 있는 경우도 있더군요. (이럴때도 따로 위처럼 계산되는 것 같습니다.)
아마 imputation이 다른 자료를 이용하여 예측을 하는 프로그램이다 보니 같은 샘플(Same Sample)에 중복위치(Same position) 다른변이(Another variants)가 생기는것 같습니다.
결론 그냥 plink쓰면 알아서 해준다.
728x90
반응형
'유전체 > GWAS' 카테고리의 다른 글
[GWAS] Genetic rick score (GRS) 구하기 (8) | 2021.04.02 |
---|---|
[R,GWAS] 카이검정 (chisq.test), 피셔검정(fisher.test) 쉽게 하기 (0) | 2021.03.09 |
[GWAS] 결과 분석하는 방법 (assoc function) (17) | 2021.02.01 |
[GWAS] Genotyping microarray 분석 시 주의해야할 concordance rate (1) | 2020.12.30 |
[GWAS] 데이터 QC하는 방법 (hardy-weinberg, missing genotype, etc) (0) | 2020.12.11 |
댓글