Variant calling을 할때 주의해야할 점이 있습니다.
저 같은 경우는 예전 VCF에 변이가 있으면 아 있구나 하고 분석에 포함을 시켰습니다.
그러다 실제 변이확인을 위해 sanger sequencing을 진행했는데 변이가 안나오는 경우를 겪었습니다. (결과를 확인하는데 키보드탁! 글자 조각들이 드래곤볼이 되어 흩어졌죠.)
왜 그랬던 걸까요?
우리가 분석해야할 VCF안에 변이는
1. Single cell에서 나온 것이 아닙니다.
2. 시퀀싱오류에 의한 변이들이 있을 수 있다.
3. Normal세포도 분명히 있다. (normal세포에서도 약간의 차이나는 변이들도 있을가능성)
- 조직을 추출할때 암부분만 골라서 추출하기 힘들고, Rare한 조직의 경우 어쩔수 없이 normal데이터가 같이 뽑힙니다.
그렇기 때문에 최근 암 연구에서는 tumor purity를 구해서 고려하기도 합니다.
Tumor purity란 말그대로 순수하게 암세포들만 뽑았느냐?!라는 말이죠.
Tumor purity를 구하는 방법으로는 여러가지가 있으나, 그건 다음 포스팅에서 할 것이고,
제가 말하고 싶은 것은 Variant Allele Frequency (VAF)라는 겁니다.
VCF를 볼때, 이 VAF만 보더라도 실제 변이가 있는지를 확인할 수가 있습니다.
NGS뎁스에 따라 기준이 바뀌지만, 저의 경우 100뎁스 기준 30뎁스 이상일 경우! 변이가 있다고 생각하시면 될것 같습니다. (약 뎁스의 30%정도는 변이가 가지고 있어야지 아 변이가 정말로 있구나 생각하시면 되죠)
이 값은 변이의 뎁스(AD)/총 뎁스(DP)로 확인할 수가 있습니다. 이 정보는 VCF에 있구요.
AD를 볼때 변이가 1개일 경우 VCF에 두개로 표현되고 있는데, 처음 것은 Ref, 다음 것은 Alt입니다.
(예시 Ref :A, Alt:T - AD에서 10,20 이런식으로 표현이 됩니다.)
유용하셨거나, 잘 보셧다면 주변 광고 한번씩만 클릭 부탁드립니다! 감사합니다!
'기본적인 개념' 카테고리의 다른 글
[Mysql] Mysql 기본 명령어 (0) | 2020.10.06 |
---|---|
[기본개념] 염기의 변이에 대한 이야기 (0) | 2020.08.18 |
[기본개념] 분석시 참고 자료 (0) | 2020.06.17 |
[기본개념] 시퀀싱 파일이름 의미! (0) | 2020.06.08 |
[기본개념] 정밀도와 재현율 (0) | 2020.06.02 |
댓글