본문 바로가기
기본적인 개념

MAF란? (Minor Allele Frequency)

by 인포메틱스 2021. 2. 1.
반응형

모든 Bio관련 분석은 특정 변이를 기반으로 분석하기 때문에 변이와 연관된 단어인 MAF는 Bioinformatics를 하면서 가장 많이 보게 되는 단어일 수 있습니다.

 

위키에 MAF는 다음과 같이 이야기하고 있습니다. (위키는 참고용으로 생각하고 있습니다.)

 

MAF는 주어진 population에서 두번째로 빈번하게 나오는 변이라고 합니다.  말 그대로 특정 population에서 Common하지 않는 (그렇다고 항상 Rare하다는 말은 아닙니다.) 변이라고 이야기합니다.

 

 

우리가 MAF를 중요하게 생각하는 이유는 바로 주어진 population에 따라서 MAF가 달라질수 있기 때문입니다.

 

예를들어 어떤 질병에 대해서 분석을 했을 경우 분석을 할때에는 질병만을 넣지 않고,  정상군도 추가로 넣어서 분석을 하게 됩니다. (대부분 정상군을 많이 넣어서 분석을 합니다.)

 

그럴때 MAF를 질병에 원인이 되는 후보 변이로 생각을 하게 됩니다.

 

그렇다고 너무 작은 MAF는 오류라고 생각하게 됩니다. (Plink에서 QC과정에서 제거를 해버리게 됩니다.)

 

만약 Rare disease를 분석할때에는 MAF에 대해서 좀 더 관대하게 뽑되 다른 population study에서 Allele Frequency를 확인해봐야겠죠.

 

예를 들어서 ExAC, gnomAD 데이터 같은 대규모 population study에서 해당변이가 실제로 있었는지 혹은 dbSNP에 있는지 등을 보시고 종합해서 결론을 내셔야합니다.

 

 


mopipe.tistory.com/107

 

[GWAS] 결과 분석하는 방법 (assoc function)

실습용 데이터는 Gilles, Annick, et al. "A pilot genome-wide association study identifies potential metabolic pathways involved in tinnitus." Frontiers in neuroscience 11 (2017): 71. 을 이용하였습니..

mopipe.tistory.com

GWAS에서 MAF확인하는 방법은 다음을 참고 하시면 됩니다.

728x90
반응형

댓글