본문 바로가기

gwas19

와우~ 오늘은 포스팅을 못하겠네요 GWAS분석하고 정리하는데 조금 시간이 많이 걸리네요.. 그래도 이런 복잡한 분석 뒤에는 같은 분석을 하더라도 금방 끝내는 것 같아 지금 하는일이 뭔가 보람찬 느낌! 어떤일이든 항상 처음이 어려운 것 같습니다. (나쁜일이든 좋은일이든) 포기만 하지 않으면 될 것 같습니다. 화이팅! QC 논문들도 읽고 있고, 설명을 잘하기위해 꼭꼭 씹어먹는중입니다. 잘 정리되는데로 포스팅 하겠습니다. 이어서 파이썬이나, R도 포스팅 시작하겠습니다. (머리에 있는것들 정리할겸에 겸사겸사 할께요 ~!) 2020. 6. 11.
[GWAS] Plink 유용한 기능 (2) (freq, hardy) 어제 포스팅에 이어서 오늘도 Plink 에서 유용한 기능 두번째!! plink를 이용해서 기본적인 통계기능들을 살펴보도록 하겠습니다. 일단 연습 문제를 만들기위해서! 다음과 같이 테스트 샘플을 만듭니다. Raw data = 이전 포스팅했던 이명관련 open data를 이용하였습니다. 파이썬이나 기타 방법으로 테스트 샘플을 만드시던지 아니면 raw data를 이용하세요! (그런데 오래걸릴 수 있습니다.) 1 . --freq[x] 분석을 진행할때, plink --bfile test_set --freqx --out freqx output : freqx.frqx 내용 : A1 , A2에 대해서 Homo, Hetero빈도수 확인이 가능합니다. plink --bfile test_set --freq --out fre.. 2020. 6. 10.
[GWAS] plink 유용한 기능 (1) (exclude, extract) plink QC를 공부하기 전에 plink에서 유용한 기능들을 다루어 보도록하겠습니다. QC는 그냥 default로 사용하는 -hwe 0.00001로 진행하고 --Geno 0.05 이런식으로는 알려드릴수 있으나, 그러면 공부하는 의미가 없죠! 그렇기 때문에 조금만 더 찾아 본 후에 포스팅 하도록 하겠습니다. plink에 유용한 기능이 생각보다 많습니다. 초창기 plink 공부할 때, plink 사이트 들어가자마자, 원하는 기능들만 쏙 빼고 창을 닫았습니다. (물박사 종특ㅎㅎㅎㅎㅎㅎ) 왜냐하면, 영어로 된것들 다 읽기 귀찮았거든요... ㅎㅎㅎㅎㅎㅎㅎ 추후에 샘플들을 추가하거나, 혹은 분석한 것이 맞는지 확인을 할 때, 결국 다시 plink에 제가 필요한 기능들이 대부분 있더군요. 오늘 포스팅할 내용은 pl.. 2020. 6. 9.
[GWAS] plink 이용해서 vcf만들기~ 저번 포스팅은 https://mopipe.tistory.com/9 Plink input format (형식확인) plink를 설치를 했으면, 설치폴더에 toy라는 파일들이 보입니다. toy.ped, toy.map 이렇게 두 파일의 경우 기본적인 plink input file format입니다. 샘플수가 많을경우 binary파일로 바꿔줘야하는데, 그렇게 바 mopipe.tistory.com plink input file에 대해서 알아보았고, 이번 포스팅 내용은 input file 만드는 법! 혹은 plink파일에서 vcf를 만드는 방법!!을 알려드리겠습니다! 연습데이터로는 A Pilot Genome-Wide Association Study Identifies Potential Metabolic Pathwa.. 2020. 6. 8.
[GWAS] plink input format (형식확인) plink를 설치를 했으면, 설치폴더에 toy라는 파일들이 보입니다. toy.ped, toy.map 이렇게 두 파일의 경우 기본적인 plink input file format입니다. 샘플수가 많을경우 binary파일로 바꿔줘야하는데, 그렇게 바꾼 파일의 경우 뒤에 .bed,.bim,.fam 가 붙습니다. 기본적인 format에서 binary파일로 변환을 시킬수가 있는데 그러면 그 폴더 내에 toy_step1.bim, .bed, .fam이 생기게 됩니다. 우선 기본적인 input format을 확인해봅시다. vi*로 아무 toy파일로 들어가게되면 두 줄이 보인다. vi = 리눅스에서 터미널을 통해 텍스트를 읽어 올 수 있다. 용량이 많을 경우 느리게 반응함. 그럴때는 less -S 을 이용함. vi와 le.. 2020. 6. 5.
[GWAS] plink 설치 및 설정하기. Plink 설치하기 일단 구버전 말고 신버전( plink 1.90 beta )를 설치를 할겁니다! 준비물을 리눅스! 생물정보학을 하려면 리눅스는 필수라고 생각합니다. (맥포함) 왜냐하면! 윈도우로 뭔가를 돌리기에는 윈도우자체가 이것저것 기본적으로 돌아가는 것도 많고, 컴돌이들이 말하는 "돌아가는 것이 무겁다?" 라는 이유때문입니다. 그리고 무엇보다도! 이 블로그 내용은 대부분 리눅스 중심으로 설명을 하려고 합니다. www.cog-genomics.org/plink/ PLINK 1.9 1: Solaris is no longer explicitly supported, but it should be able to run the Linux binaries. 2: These are just mirrors of th.. 2020. 6. 4.