본문 바로가기

deep learning23

[pytorch 설정] pytorch gpu 설정하는 방법 최근들어 Deep learning 관련 연구를 진행하게 되었습니다. deep learning을 진행하기 위해서는 R 보다는 python에서 실행하는것이 더 효율적입니다. (더 빠르고 정보가 많습니다.) 예전에 깔짝되던 Tensorflow, pytorch 중에 고민을 하다가 pytorch로 분석을 시작하게 되었고, pytorch중에서 GPU를 사용하는 방법에 대해서 설명하겠습니다. 먼저 cuda설정이 되어있는지 확인하려면 다음과 같이 python 코드를 짜면 됩니다. import torch print(torch.cuda.is_available()) # False = cpu # True = gpu 사용가능 cuda가 설정이 안되어 있으면 아래 쭈욱 읽어보시면 됩니다. 스펙은 다음과 같습니다. (그냥 컴퓨존에.. 2021. 12. 3.
[pytorch] tensor를 이해해보자! tensor라 함은 3차원 이상의 데이터를 이야기합니다. 0차원은 scaler, 1차원은 vector, 2차원은 matrix (행렬) 이라고 하죠. 우리가 딥러닝을 배우면서 많이 다루게될 데이터는 2차원 이상의 데이터입니다. 그렇다면 2차원 이상의 데이터를 어떻게 생각해야할까요?! 아래 그림을 보면서 설명하도록 하겠습니다. 위 사람사진에 대해서 얻을수 있는 데이터를 상상해 봅시다. 유전자에 대해서 알수가 있을 것 같고, 뼈사진을 통해 건강한 뼈를 가진 사람인지도 알 수가 있을것같구요. 그리고 키도 알 수가 있겠죠. (정확한 수치는 사진에 나오지 않았지만 알수있다고 가정해봅시다.) 한 사람에서 나오는 데이터의 양을 유전자, 뼈상태, 키 이렇게 대략 알 수가 있을 것입니다. 여기서 유전자, 뼈상태, 키 각각.. 2021. 8. 5.
[pytorch] tensor 나누는 방법들 (split, chunks, 데이터 나누기) tensor는 데이터를 이야기합니다. 2차원을 2 Tensor 3차원을 3 Tensor라고 이야기 하죠. 딥러닝을 돌리다 보면 이러한 tensor를 나눠서 돌려야할 때가 있습니다. batch size를 조절하거나 혹은 test set, validation set, train set을 나눌때도 이러한 데이터를 나눠야 합니다. 그럴때 사용할수 있는 간단한 방법을 설명하고자 합니다. split, chunks는 자세히 설명하지 않으면 조금 헷갈릴수가 있는 기능입니다. split의 경우 데이터당 최대 자료가 n개를 가지게 하는 방법이고, chunks의 경우 데이터를 n개로 나누는 거죠. chunk와 split의 위의 설명으로는 헷갈릴수가 있으니 예시를 보여주도록 하겠습니다. 같은 17줄을 split와 chunk로.. 2021. 8. 3.
[DB소개] Cancer Cell Line Encyclopedia (CCLE) Cell line이란 간단하게 우리몸의 세포를 일부 떼어내어 조직을 길러낸 것을 말합니다. 이러한 Cell line을 만드는 이유는 어떠한 질병에 대해 연구를 할때 사람을 대상으로 연구가 이루어 질때 많은 어려움들이 있습니다. 예를들어 세포에 자극을 주고 반응을 본다던지, 혹은 일정경과를 지낸 후에 세포가 어떻게 변화하는지에 대해서 알고싶은 경우가 있습니다. 이럴때 실제 사람으로 하게되면 윤리적으로 문제가 발생이 됩니다. 또한 어떠한 특이한 질병을 갖는 환자들에 대해서도 실제 실험을 하게되면 환자의 목숨을 위협할 수가 있고, 또한 소중한 연구데이터가 사라질 수도 있습니다. (사람 목숨을 연구재료로만 생각하는 뜻이 아닙니다.) 이러한 단점들을 해결하고자 연구자들은 환자들의 환부에 있는 세포를 떼어내어 배양.. 2021. 4. 5.
[내돈내산] 패스트캠퍼스 강의 진행중 이번에 1+1 행사를 하는김에 겸사겸사 여러 강의들을 샀습니다. 그중에 Bioinformatics강의가 있어서 아주 비싼돈주고 삿는데, 실망하는중입니다. 인도출신의 강사인데 생각보다 퀄리티가 낮다는 생각이 듬니다. 현재 듣고 있는데 느낀점 강의 신청할 때에는 7시간이라고 해서 신청을 하니 실제 강의시간은 5시간 좀 안되는 수업. 그리고 문의를 하니 추가 업데이트를 한다고 하는데.. 어떨지는.. 모르겠습니다. 또한 실습 강의답게 돌리는 시간, 강사가 해메는 시간까지 포함 5시간이라는 점이 별로라는 생각이 듭니다. 조금 돈을 들여서 우리나라 학회 워크샵을 듣는 것이 더 효율적이라고 생각이 듭니다. (번역도 별로 마음에 들지는 않네요.) 그래도 장점 하나를 말해보자면, 그냥 세계적 기업에 들어가려면 저런 연구.. 2021. 3. 17.