딥러닝을 연습하기 위해서는 다양한 경험이 필수인듯합니다.
제가 공부하면서 찾은 사이트들 공유드립니다. 추가로 업데이트 진행할 예정입니다.
1. TCGA 데이터가 있는 GDC 사이트이고, 병리이미지를 다운받을수 있습니다. 단점은 level이 3~4개정도 밖에 없습니다. 그래도 몇 안되는 WSI 데이터를 다운 받을 수 있는 곳 입니다.
https://portal.gdc.cancer.gov/
GDC
We detected you are using Internet Explorer. This site is best viewed with Chrome, Edge, or Firefox.
portal.gdc.cancer.gov
2. colon관련 이미지를 찾다가 찾은 데이터 베이스입니다. segmentation 데이터도 있고, patch데이터도 있었던것 같습니다.
https://warwick.ac.uk/fac/cross_fac/tia/
Tissue Image Analytics Centre - University of Warwick
Tissue Image Analytics (TIA) Centre
warwick.ac.uk
3. kaggle에서도 생각보다 많은 데이터를 공유하고있으니 찾아 보시길 바랍니다.
4. colon cancer 관련 patch 데이터 공개를 해놓고 있고, TCGA데이터입니다. (patch별 annotation이 되어있기 때문에 TCGA보다 분석하기 더 좋을 것입니다.)
https://zenodo.org/record/1214456#.Ymc7vfNBzeo
100,000 histological images of human colorectal cancer and healthy tissue
Data Description "NCT-CRC-HE-100K" This is a set of 100,000 non-overlapping image patches from hematoxylin & eosin (H&E) stained histological images of human colorectal cancer (CRC) and normal tissue. All images are 224x224 pixels (px) at 0.5 microns per p
zenodo.org
추후에 지속적으로 업데이트 하도록 하겠습니다.
감사합니다.
'딥러닝\머신러닝' 카테고리의 다른 글
[pytorch, 딥러닝] CUDA out of memory 에러 해결방법(이미지분석) (0) | 2022.08.10 |
---|---|
[pytorch, 딥러닝] pin_memory 란 무엇인가? (0) | 2022.08.10 |
[pytorch, 이미지분석] CustomDataset 제작시 주의해야할 점. (0) | 2022.08.05 |
[pytorch, 딥러닝] 모델 저장하는 방법 (0) | 2022.07.28 |
[pytorch, 딥러닝] pytorch로 딥러닝 할 때 중요한 부분 (Dataset) (0) | 2022.07.27 |
댓글