모든 Bio관련 분석은 특정 변이를 기반으로 분석하기 때문에 변이와 연관된 단어인 MAF는 Bioinformatics를 하면서 가장 많이 보게 되는 단어일 수 있습니다.
위키에 MAF는 다음과 같이 이야기하고 있습니다. (위키는 참고용으로 생각하고 있습니다.)
MAF는 주어진 population에서 두번째로 빈번하게 나오는 변이라고 합니다. 말 그대로 특정 population에서 Common하지 않는 (그렇다고 항상 Rare하다는 말은 아닙니다.) 변이라고 이야기합니다.
우리가 MAF를 중요하게 생각하는 이유는 바로 주어진 population에 따라서 MAF가 달라질수 있기 때문입니다.
예를들어 어떤 질병에 대해서 분석을 했을 경우 분석을 할때에는 질병만을 넣지 않고, 정상군도 추가로 넣어서 분석을 하게 됩니다. (대부분 정상군을 많이 넣어서 분석을 합니다.)
그럴때 MAF를 질병에 원인이 되는 후보 변이로 생각을 하게 됩니다.
그렇다고 너무 작은 MAF는 오류라고 생각하게 됩니다. (Plink에서 QC과정에서 제거를 해버리게 됩니다.)
만약 Rare disease를 분석할때에는 MAF에 대해서 좀 더 관대하게 뽑되 다른 population study에서 Allele Frequency를 확인해봐야겠죠.
예를 들어서 ExAC, gnomAD 데이터 같은 대규모 population study에서 해당변이가 실제로 있었는지 혹은 dbSNP에 있는지 등을 보시고 종합해서 결론을 내셔야합니다.
GWAS에서 MAF확인하는 방법은 다음을 참고 하시면 됩니다.
'기본적인 개념' 카테고리의 다른 글
[Mysql] Mysql 기본 명령어 (0) | 2020.10.06 |
---|---|
[기본개념] 염기의 변이에 대한 이야기 (0) | 2020.08.18 |
[기본개념] Variant Calling 할때 주의점 (0) | 2020.08.07 |
[기본개념] 분석시 참고 자료 (0) | 2020.06.17 |
[기본개념] 시퀀싱 파일이름 의미! (0) | 2020.06.08 |
댓글