본문 바로가기

기본적인 개념19

[기본개념] Variant Calling 할때 주의점 Variant calling을 할때 주의해야할 점이 있습니다. 저 같은 경우는 예전 VCF에 변이가 있으면 아 있구나 하고 분석에 포함을 시켰습니다. 그러다 실제 변이확인을 위해 sanger sequencing을 진행했는데 변이가 안나오는 경우를 겪었습니다. (결과를 확인하는데 키보드탁! 글자 조각들이 드래곤볼이 되어 흩어졌죠.) 왜 그랬던 걸까요? 우리가 분석해야할 VCF안에 변이는 1. Single cell에서 나온 것이 아닙니다. 2. 시퀀싱오류에 의한 변이들이 있을 수 있다. 3. Normal세포도 분명히 있다. (normal세포에서도 약간의 차이나는 변이들도 있을가능성) - 조직을 추출할때 암부분만 골라서 추출하기 힘들고, Rare한 조직의 경우 어쩔수 없이 normal데이터가 같이 뽑힙니다. .. 2020. 8. 7.
[실험기본] primer 디자인 (제작) 오늘은 primer제작에 대해서 이야기 하려고 합니다. primer 디자인하는 것은 BI로서는 조금 생소 할수도 있을 것 같습니다. (BI 대부분 컴돌이라서.. ?) 그래도 만약 소규모 렙이나 회사에 간다면 이런것 즈음 간단하게 알아 주면 괜찮겠죠? 프라이머 제작을 하는 이유는 여러가지가 있겠지만, 저는 Sanger sequencing(생어 시퀀싱)을 하기 위한 프라이머 제작을 몇번 해보았습니다. (프라이머 제작은 아마 다 비슷하지 않을까요?) 일단 그전에 생어 시퀀싱을 하는 이유에 대해서 이야기 해보자면 NGS, Genotype array 분석에서 분석자들이 찾은 변이가 그 위치에 실제 있는지 확인차 하는 것입니다. 프라이머를 제작하기 위해서는 필요한 것이 당연히 확인 해야할(하고싶은) 시퀀스죠! 확인.. 2020. 6. 29.
[기본개념] 분석시 참고 자료 유전체 분석시 참고자료를 찾아서 올립니다. 한국보건산업진흥원에도 이런자료가 있네요~! www.google.com/url?sa=t&rct=j&q=&esrc=s&source=web&cd=&ved=2ahUKEwiuhuzd84XqAhVVHaYKHUyRCakQFjACegQIBRAB&url=https%3A%2F%2Fwww.khidi.or.kr%2FfileDownload%3FtitleId%3D352163%26fileId%3D1%26fileDownType%3DC%26paramMenuId%3DMENU01872&usg=AOvVaw0Uo0dRzuprkiHwxrJHbqjL https://www.google.com/url?sa=t&rct=j&q=&esrc=s&source=web&cd=&ved=2ahUKEwiuhuzd84XqAh.. 2020. 6. 17.
[실험기본] DNA 분리방법 Bioinformatics를 주로 하다보면 실험적인 개념이 모자랄 때가 있다. 이번에 소개할 내용은 DNA 분리시에 알아둬야할 개념들을 정리하였다. 조직, 모근 구강 상피세포, 배양된 세포 및 혈액 등으로 부터 Genomic DNA분리 가능함. 많은 양의 유전체 시료가 필요할 때는 사람의 경우 B세포를 Epstein -Barr virus (EBV)로 감염시켜서 불멸화(Immortalized) 를 유도한다. 그리고 Lymphoblastoid cell line (LCLs)를 만들어서 사용하고 있다. 그러나 이러한 방법은 불멸화유도과정 혹은 배양과정에서 새로운변이가 생길 수 있는 문제점이 있다. * EBV의 경우 lymphoma, carcinoma와도 연관이 있음. 헤르페스 바이러스라고 생각하면됨.(1) 최근.. 2020. 6. 15.
[기본개념] 시퀀싱 파일이름 의미! NCBI에서 유전자들을 찾아볼 때, Reference Sequence를 확인할 수가 있다. 여기서 Reference sequencing을 보게되면 NM_머시기라고 되어있는것을 확인할 수가 있다. 가끔 NM말고도 다른 prefix를 보인는데 다음과 같이 정리하였다. Accession Prefix Molecule type Comment AC_ Genomic Complete genomic molecule, usually alternate assembly NC_ Genomic Complete genomic molecule, usually alternate assembly NG_ Genomic Incomplete genomic region NT_ Genomic Contig or scaffold, clone-bas.. 2020. 6. 8.
[기본개념] 정밀도와 재현율 실측값 (Observation value) Positive Negative 예측값 (Prediction value) Positive True positive (TP) False Negative (FN) (1종 오류) Negative False positive (FP) (2종 오류) True negative (TN) 정밀도(Positive predictive value)를 확인하기 위해서는 Precision = TP / (TP+FP) 재현률(Sensitivity)을 확인하기 위해서는 Recall = TP / (TP+FN) Specificity (True Negative Rate)를 확인하기 위해서는 specificity = TN / (TN+FP) Accuracy (정확도)를 확인하기 위해서는 Accurac.. 2020. 6. 2.