본문 바로가기
기본적인 개념

[기본개념] Variant Calling 할때 주의점

by 인포메틱스 2020. 8. 7.
반응형

 Variant calling을 할때 주의해야할 점이 있습니다.

 

 저 같은 경우는 예전 VCF에 변이가 있으면 아 있구나 하고 분석에 포함을 시켰습니다.

 

그러다 실제 변이확인을 위해 sanger sequencing을 진행했는데 변이가 안나오는 경우를 겪었습니다. (결과를 확인하는데 키보드탁! 글자 조각들이 드래곤볼이 되어 흩어졌죠.)

 

왜 그랬던 걸까요?

 

우리가 분석해야할 VCF안에 변이는

 

1. Single cell에서 나온 것이 아닙니다.

2. 시퀀싱오류에 의한 변이들이 있을 수 있다.

3. Normal세포도 분명히 있다. (normal세포에서도 약간의 차이나는 변이들도 있을가능성)

  - 조직을 추출할때 암부분만 골라서 추출하기 힘들고, Rare한 조직의 경우 어쩔수 없이 normal데이터가 같이 뽑힙니다.

 

그렇기 때문에 최근 암 연구에서는 tumor purity를 구해서 고려하기도 합니다.

 

출처 : https://www.biostars.org/p/240663/

 

Tumor purity란 말그대로 순수하게 암세포들만 뽑았느냐?!라는 말이죠.

 

Tumor purity를 구하는 방법으로는 여러가지가 있으나, 그건 다음 포스팅에서 할 것이고,

 

 제가 말하고 싶은 것은 Variant Allele Frequency (VAF)라는 겁니다.

 

VCF를 볼때, 이 VAF만 보더라도 실제 변이가 있는지를 확인할 수가 있습니다.

 

NGS뎁스에 따라 기준이 바뀌지만, 저의 경우 100뎁스 기준 30뎁스 이상일 경우! 변이가 있다고 생각하시면 될것 같습니다. (약 뎁스의 30%정도는 변이가 가지고 있어야지 아 변이가 정말로 있구나 생각하시면 되죠)

 

이 값은 변이의 뎁스(AD)/총 뎁스(DP)로 확인할 수가 있습니다. 이 정보는  VCF에 있구요.

 

AD를 볼때 변이가 1개일 경우 VCF에 두개로 표현되고 있는데, 처음 것은 Ref, 다음 것은 Alt입니다.

(예시 Ref :A, Alt:T - AD에서 10,20 이런식으로 표현이 됩니다.)

 

 


유용하셨거나, 잘 보셧다면 주변 광고 한번씩만 클릭 부탁드립니다! 감사합니다!

 

 

728x90
반응형

댓글