본문 바로가기

분류 전체보기206

[slurm] slurm, ubuntu22.04에서 설치해보자. with gpu setting 오랜만에 포스팅을 합니다. 하두 포스팅을 안하다보니, 방문자수도 많이 줄었더라구요.. 이게 사람이 많이 들어오다가 안오게 되면 뭔가 똥줄이 타는 느낌이 들더라구요.. 1. introduction 최근에 slurm을 설치해서 job schedule을 체계적으로 해야하겠다 싶어서 설치해보았습니다. slurm은 오픈소스(다른말로 공짜)입니다. 여러가지 일을 동시에 진행할때, 차례대로 일을 진행시켜주는 아주 고마운 프로그램입니다. 사실 박사과정때 담당 교수님이 설치해준걸 써보기만 했지, 실제 설치까지 해보지는 않았습니다. 실제 설치해보니.. 정말 힘들더라구요.. 다양하게 시도 하였고, 결과적으로 성공하였습니다. ubuntu 22.04에서 slurm-wlm 21.08.05 를 설치를 완료하였고, gpu까지 세팅완.. 2024. 7. 15.
[머신러닝] K-means 알고리즘을 배우기 1. Intro  대부분의 머신러닝 알고리즘은 라벨이 있는 데이터를 예측하는데 유용합니다. 이를 Supervised learning (지도 학습)이라고 합니다. 하지만 라벨이 없는 데이터 세트를 처리해야할 때가 많습니다. 이러한 문제는 Unsupervised learning비지도 학습 기법으로 해결할 수 있습니다. K-means 알고리즘은 데이터 세트를  K개의 클러스터로 나누는 비지도 학습 알고리즘입니다. 유사한 방법으로는 KNN방법이 있습니다. 해당 방법은 추후에 설명하도록 하겠습니다. 2. K-means 알고리즘의 역활 K-means 알고리즘은 데이터를 주어진 클러스터 수로 분할합니다. 각 클러스터 내의 데이터 포인트는 유사하고, 다른 클러스터의 포인트와는 차이가 큽니다. 유사성은 주로 유클리드 거.. 2024. 5. 27.
[Deep learning 공부] 딥러닝 공부 포스팅링크 업로드 제대로 공부해보기 위한 커리큘럼! 1. 기초 지식 학습수학 및 통계 선형대수학 : 벡터, 행렬, 행렬곱, 고유값, 고유벡터미분방정식 및 미적분학 : 편미분, 기울기, 체인룰확률 및 통계 : 확률 분포, 기대값, 분산, 조건부 확률프로그래밍python 프로그래밍 : 기본 문법, 자료 구조, 함수 클래스라이브러리 : Numpy, Pandas, Maplotlib2. 기초 머신러닝기초개념 : 지도학습, 비지도 학습, 분류, 회귀기본 알고리즘 : 선형회귀, 로지스틱 회귀, K-Nearest-Neighbor, 결정 트리, SVM평가 방법 : 교차 검증, 과적합과 과소적합, ROC곡선3. 딥러닝 기초신경망 기본 개념 : 퍼셉트론, 활성화 함수, 역전파 알고리즘프레임워크 소개 : TensorFlow, Keras, Py.. 2024. 5. 24.
[FDA관련 약어] RMAT? BTD?란 무엇일까? 제약 관련 약어 정리 어떠한 투자를 하기 전에 많은 정보들을 얻을 수 있어야 합니다. 왜냐하면 전문적인 영역까지 이해를 해야만 회사들의 현재 상태를 알 수 있기 때문이죠.  이번에 Iovance Biotherapeutics, Crispr therapeutics나 Apellis Pharmace와 같은 회사들을 보면서 절실하게 느꼈습니다.  전문적인 영역을 이해하기 위해서는 약어들에 대해 정리가 필요합니다. 회사들의 현재상태와 비전을 확인할 수 있는 ppt를 보게되면 설명없는 약어들이 많습니다.  1. 기초적인 약어 설명 제약관련 기초적인 약어 중에는 우리가 많이 보았던, 약어들이 많습니다.- IND (Investigational New Drug Application) : 새로운 약물이나 생물학적 제제의 임상 시험을 시작하기 전.. 2024. 5. 22.
[Quantum-si, QSI] 단백실 시퀀싱업체 2024년 첫 발표자료 리뷰 1. Intro 안녕하십니까. 오늘은 제가 투자하고 있는 기업이기도 한 Quantum-si 에서 오랜만에 발표자료가 나와서 이야기 해보고자 합니다. 2. 단백질 분석의 중요성? 단백질을 분석한다는 것은 생명을 연구하는데에 있어서 아주 중요합니다. DNA가 설계도, RNA가 감독관이라면, 단백질은 결과물이라고 볼 수 있습니다. 결과물들에 따라 질병의 연관성이 발생될 수 있습니다. 그런데 대부분의 과학 연구들을 보면 DNA, RNA분석이 주를 이룹니다. 왜냐하면 단백질을 분석하기가 정말 힘들기 때문입니다. 단백질 분석이 어려운 이유는 다음과 같습니다. - 구조적 복잡성, 동적인 성질 (온도, ph(산도), 화학정 환경 변화에 민감), 상호작용의 복잡성 (여러 요인들과 상호작용을 하는 것으로 알려짐), 기능적.. 2024. 4. 11.
[pytorch vs. Tensorflow] 딥러닝 프레임워크? 어떤 차이가 있을까? 1. Intro python으로 Deep learning 연구를 할때, 대부분의 사람들이 pytorch, Tensorflow를 이용합니다. 저는 pytorch를 이용합니다. 그런데 이 둘의 차이점에 대해서 궁금해 보신적이 없나요? 저도 항상 궁금하던 찰나에 외국 블로그를 참고하여 정리해 보았습니다. 2. pytorch vs. Tensorflow pytorch는 Facebook 그룹이 제작을 하였고, 2017년 github를 통해 open-source로 공개되었습니다. Tensorflow는 구글에서 만들어졌고, pytorch보다 더 일찍인 2015년에 open-source로 공개가 되었습니다. 그리고 구글에서 제작하다보니 안드로이드를 포함한 다양한 장치와의 호환성으로 인해 많은 스타트업이나, 조직에서 사용.. 2024. 4. 4.