본문 바로가기

imputation3

[MS,protein] 단백질양 imputation 방법소개 1. 서론 단백질은 표현형에 직접적인 관여를 하기 때문에 중요합니다. 그러나 단백질을 정확하게 측정하기 위해서는 많은 요인들 때문에 힘듬니다. 예를 들어 post translational modification (전사후 수정과정)으로 인해서 단백질들이 변화 할수도 있고, 단백질의 특성상 반감기가 짧은 단백질이라던지 등 많은 요인들이 있습니다. 위 같은 요인은 둘째치더라도 조직들의 단백질 양을 이용한 분석을 통해 질병군과 대조군 사이 마커를 찾는다던지 Differential Expression Gene (DEG)가 실제로 단백질양에서도 변화를 일으키는지 등을 보기 위한 연구가 많이 이루어지고 있습니다. 뭐 단순하게 발현이 됬다 안됬다를 보기 위해서는 western blot을 이용하면 되지만 RNA 양을 비.. 2021. 12. 2.
[GWAS] Imputation 시에 중복된 변이의 경우에는? 한국인 칩을 분석을 하면서 가끔 무언가를 샘플 그룹을 나누고 합치고 하다보면 중복되는 변이가 있는 것을 발견합니다. 이럴때는 plink에서는 어떻게 처리를 할까요? 예전 분석을 할때, 위와 같은 경우가 발생하여 --freqx라는 기능으로 각 변이의 frequence를 확인해보니 무조건 변이가 있는 경우는 Case 없는 경우는 Control로 잡습니다. (두 변이다 frequency의 총합은 같구요) 그리고 조금 더 보니 Imputation을 진행하다보면 같은 위치에서도 같은 샘플에서 다른 변이를 갖고 있는 경우도 있더군요. (이럴때도 따로 위처럼 계산되는 것 같습니다.) 아마 imputation이 다른 자료를 이용하여 예측을 하는 프로그램이다 보니 같은 샘플(Same Sample)에 중복위치(Same p.. 2021. 3. 3.
우리나라 최대, 최고의 데이터 KOGES에 대한 생각 카테고리가 대학원생활입니다. 제가 생각하는 KOGES에 대해서 이야기하는것이니 다른 의견이 있으시면 댓글 달아주세요! KOGES란 질병관리청에서 데이터를 생성하고 있는 한국인 유전체 역학 조사사업으로 국내 최대 규모의 코호트 연구라고 이야기들 합니다. KOGES에서는 Array데이터를 이용을 하여 대규모 유전체 데이터를 생산하고 있는데, 우리나라에서 개발한 K-chip을 사용합니다. www.cdc.go.kr/contents.es?mid=a40504030900 질병관리청 국립보건연구원 질병관리청 국립보건연구원 www.cdc.go.kr 위 사이트에서는 KOGES에서 몇명의 데이터가 있는지 대략적으로 알수가 있습니다. 생각보다 많은 데이터를 갖고 있지만, 저도 혹은 주변에서 KOGES 데이터를 사용도 해보았고.. 2021. 2. 1.