본문 바로가기

plink9

[GWAS] Genetic rick score (GRS) 구하기 오늘은 Genetic risk score (GRS)에 대한 이야기와 실습을 해보고자 합니다. GWAS 기본 분석은 정말 간단하게 이루어지는 연구입니다. 단지 Case, Control간에 chi-test를 이용하여 변이들의 p-value를 확인하면 되는 부분이죠. 이렇게 반복 결과만 이용해서 논문을 내다 보니 출간 논문에는 특별한 것이 없어지고, 샘플수에 더 초점이 맞춰졌던 것 같습니다. (이것 이외에도 샘플수에 초점이 맞춰진 이유는 다양합니다. 통계적인 파워 때문일 수도 있고, 특정 소수에게만 적용되는 변이일수도 있기 때문에 샘플수는 GWAS분석에 있어서 중요합니다.) 그러다 사람들이 변이의 p-value를 확인하는 것 이외에 생각을 한 것이 실제 찾은 변이들의 효과를 평가하는 것이었습니다. "이러한 S.. 2021. 4. 2.
[R,GWAS] 카이검정 (chisq.test), 피셔검정(fisher.test) 쉽게 하기 GWAS분석 툴인 Plink를 사용하면 흔하게 볼 수 있는 Header는 CHISQ입니다. 카이 검정이라고 하는 이 CHISQ는 R에서도 쉽게 확인할 수가 있습니다. 카이 검정이나 피셔 검정의 목적은 내가 분석할 데이터들이 실측값 예측값을 이용하여 실측값들이 모집단(예측값)에 맞다.에 대한 오류가 있을 확률을 구하는 것입니다. 영가설 : 예측값들이 실측값과 비슷하다. 큰차이가 나지 않을 것이다. 대립가설 : 예측값들이 실측값과 다르다. 큰차이가 날 것이다. 두 집단이 동일한지 확인 (GWAS에서 plink에서 이용) 영가설 : 두 집단이 비슷할 것이다. 대립가설 : 두 집단이 다를 것이다. 두 개 이상의 변수가 독립성을 띄는지 아닌지 확인 영가설 : 두 집단이 독립적일 것이다. 대립가설 : 두 집단이 독.. 2021. 3. 9.
[GWAS] Imputation 시에 중복된 변이의 경우에는? 한국인 칩을 분석을 하면서 가끔 무언가를 샘플 그룹을 나누고 합치고 하다보면 중복되는 변이가 있는 것을 발견합니다. 이럴때는 plink에서는 어떻게 처리를 할까요? 예전 분석을 할때, 위와 같은 경우가 발생하여 --freqx라는 기능으로 각 변이의 frequence를 확인해보니 무조건 변이가 있는 경우는 Case 없는 경우는 Control로 잡습니다. (두 변이다 frequency의 총합은 같구요) 그리고 조금 더 보니 Imputation을 진행하다보면 같은 위치에서도 같은 샘플에서 다른 변이를 갖고 있는 경우도 있더군요. (이럴때도 따로 위처럼 계산되는 것 같습니다.) 아마 imputation이 다른 자료를 이용하여 예측을 하는 프로그램이다 보니 같은 샘플(Same Sample)에 중복위치(Same p.. 2021. 3. 3.
[GWAS] plink에 유용한 기능 (3) (filter-case,controls,males, etc) plink에 그냥 있는 기능 몇 개 소개하겠습니다. (아침이라 간단하게!) plink --bfile pre-filename --filter-cases --make-bed --out case_only plink --bfile pre-filename --filter-controls --make-bed --out control_only plink --bfile pre-filename --filter-males --make-bed --out male_only plink --bfile pre-filename --filter-females --make-bed --out female_only plink --bfile pre-filename --filter-founders --make-bed --out founder_.. 2020. 6. 22.
[GWAS] Plink 유용한 기능 (2) (freq, hardy) 어제 포스팅에 이어서 오늘도 Plink 에서 유용한 기능 두번째!! plink를 이용해서 기본적인 통계기능들을 살펴보도록 하겠습니다. 일단 연습 문제를 만들기위해서! 다음과 같이 테스트 샘플을 만듭니다. Raw data = 이전 포스팅했던 이명관련 open data를 이용하였습니다. 파이썬이나 기타 방법으로 테스트 샘플을 만드시던지 아니면 raw data를 이용하세요! (그런데 오래걸릴 수 있습니다.) 1 . --freq[x] 분석을 진행할때, plink --bfile test_set --freqx --out freqx output : freqx.frqx 내용 : A1 , A2에 대해서 Homo, Hetero빈도수 확인이 가능합니다. plink --bfile test_set --freq --out fre.. 2020. 6. 10.
[GWAS] plink 이용해서 vcf만들기~ 저번 포스팅은 https://mopipe.tistory.com/9 Plink input format (형식확인) plink를 설치를 했으면, 설치폴더에 toy라는 파일들이 보입니다. toy.ped, toy.map 이렇게 두 파일의 경우 기본적인 plink input file format입니다. 샘플수가 많을경우 binary파일로 바꿔줘야하는데, 그렇게 바 mopipe.tistory.com plink input file에 대해서 알아보았고, 이번 포스팅 내용은 input file 만드는 법! 혹은 plink파일에서 vcf를 만드는 방법!!을 알려드리겠습니다! 연습데이터로는 A Pilot Genome-Wide Association Study Identifies Potential Metabolic Pathwa.. 2020. 6. 8.