본문 바로가기
유전체/GWAS

[GWAS] Imputation 시에 중복된 변이의 경우에는?

by 인포메틱스 2021. 3. 3.
반응형

 

한국인 칩을 분석을 하면서 가끔 무언가를 샘플 그룹을 나누고 합치고 하다보면 중복되는 변이가 있는 것을 발견합니다.

 

이럴때는 plink에서는 어떻게 처리를 할까요?

 

예전 분석을 할때, 위와 같은 경우가 발생하여 --freqx라는 기능으로 각 변이의 frequence를 확인해보니 무조건 변이가 있는 경우는 Case 없는 경우는 Control로 잡습니다. (두 변이다 frequency의 총합은 같구요)

 

그리고 조금 더 보니 Imputation을 진행하다보면 같은 위치에서도 같은 샘플에서 다른 변이를 갖고 있는 경우도 있더군요. (이럴때도 따로 위처럼 계산되는 것 같습니다.)

 

아마 imputation이 다른 자료를 이용하여 예측을 하는 프로그램이다 보니 같은 샘플(Same Sample)에 중복위치(Same position) 다른변이(Another variants)가 생기는것 같습니다.

 

결론 그냥 plink쓰면 알아서 해준다.

728x90
반응형

댓글