본문 바로가기
딥러닝\머신러닝

[딥러닝 연습문제] 딥러닝 연습용 데이터 공유

by 인포메틱스 2022. 8. 8.
반응형

 

딥러닝을 연습하기 위해서는 다양한 경험이 필수인듯합니다.

 

제가 공부하면서 찾은 사이트들 공유드립니다. 추가로 업데이트 진행할 예정입니다.

 

1. TCGA 데이터가 있는 GDC 사이트이고, 병리이미지를 다운받을수 있습니다. 단점은 level이 3~4개정도 밖에 없습니다. 그래도 몇 안되는 WSI 데이터를 다운 받을 수 있는 곳 입니다.

https://portal.gdc.cancer.gov/

 

GDC

We detected you are using Internet Explorer. This site is best viewed with Chrome, Edge, or Firefox.

portal.gdc.cancer.gov

 

2. colon관련 이미지를 찾다가 찾은 데이터 베이스입니다. segmentation 데이터도 있고, patch데이터도 있었던것 같습니다. 

https://warwick.ac.uk/fac/cross_fac/tia/

 

Tissue Image Analytics Centre - University of Warwick

Tissue Image Analytics (TIA) Centre

warwick.ac.uk

 

3. kaggle에서도 생각보다 많은 데이터를 공유하고있으니 찾아 보시길 바랍니다.

 

4. colon cancer 관련 patch 데이터 공개를 해놓고 있고, TCGA데이터입니다. (patch별 annotation이 되어있기 때문에 TCGA보다 분석하기 더 좋을 것입니다.)

https://zenodo.org/record/1214456#.Ymc7vfNBzeo

 

100,000 histological images of human colorectal cancer and healthy tissue

Data Description "NCT-CRC-HE-100K" This is a set of 100,000 non-overlapping image patches from hematoxylin & eosin (H&E) stained histological images of human colorectal cancer (CRC) and normal tissue. All images are 224x224 pixels (px) at 0.5 microns per p

zenodo.org

 

추후에 지속적으로 업데이트 하도록 하겠습니다.

 

감사합니다.

 

728x90
반응형

댓글