본문 바로가기
딥러닝\머신러닝/이미지분석

[image분석] 의료이미지데이터 분석 준비

by 인포메틱스 2022. 3. 21.
반응형

1. 의료 이미지 데이터 준비

 

의료 이미지 데이터는 다양합니다. 그중에서 여기서 다룰 내용은 H&E 이미지 슬라이드에 대한 것입니다.

 

H&E 이미지는 단순 세포슬라이스에서 염색을 하는 데이터입니다. 염색에 대한 자세한 내용은 생략하겠습니다. 

 

이 이미지에서 우리가 얻을수 있는 것은 암세포가 어떻게 생겨먹었는지 확인이 가능합니다. 그렇기 때문에 병리학적으로 진단이 가능합니다. (암세포 뿐만아니라 주변 미세환경을 확인가능합니다.)

 

 최근들어 다양한 회사에서 H&E slide한장으로 병리과 진단을 위한 이미지 모델제작을 시도중에 있습니다. (뭐 사람눈으로 보는 것도 어느정도 에러가 있을터인데, 컴퓨터를 이용하면 좀더 정확하고 빠르게 가능하니까요.)

 

이렇게 이미지 모델을 제작하기 위해서는 모델 training이 필요한데 이때에는 병리과 의사들의 판단을 필요로 합니다. 

 

 병리과 의사들이 H&E 슬라이드를 보고 annotation을 진행하게 되는데, 그럴때 사용하는 프로그램중 하나가 ASAP라는 tool입니다. (ASAP는 tool중 하나일뿐 다양한 tool이 존재합니다.)

 

이번 시간에는 ASAP를 이용하여 연습용 이미지 데이터에다가 training할 부분을 표시하고 나온 결과값들을 확인해보는 시간을 갖도록 하겠습니다.

 

연습용 데이터의 경우 openslide python에서 연습용 이미지를 공개 해놓고 있습니다.

 

2. ASAP 다운받고 설치하기, 연습용 데이터 다운받기

 

ASAP의 홈페이지는 다음과 같습니다.

 

https://computationalpathologygroup.github.io/ASAP/#contact

 

ASAP - Automated Slide Analysis Platform

About Us ASAP (Automated Slide Analysis Platform) was developed by the Computation Pathology Group, part of the Diagnostic Image Analysis Group, at the Radboud University Medical Center. It was started after frustration with the current freely available so

computationalpathologygroup.github.io

 

프로그램을 다운받는 곳은 다음과 같습니다.

https://github.com/computationalpathologygroup/ASAP/releases

 

Releases · computationalpathologygroup/ASAP

Program for the analysis and visualization of whole-slide images in digital pathology - computationalpathologygroup/ASAP

github.com

 

저는 ASAP 1.9버전을 이용하겠습니다. (참고로 저는 window용 프로그램을 이용하려고 합니다.)

 

알아서 잘 설치하시고, 연습용 그림을 얻고자 합니다. (아래 참조, 링크 아래에 test data 링크 또 들어가셔서 다운!)

https://openslide.org/formats/mirax/

 

MIRAX format

MIRAX format Format multi-file with very complicated proprietary metadata and indexes File extensions .mrxs OpenSlide vendor backend mirax Detection OpenSlide will detect a file as MIRAX if: The file is not a TIFF. The filename ends with .mrxs. A directory

openslide.org

 

CMU-1-Exported를 다운받았습니다. 그리고 압축을 풀게 되면 다음과 같이 보입니다.

 

 

2-1. 파일 열어보기

그리고 ASAP프로그램을 실행 후에 열어 봅니다.

 

 

2-2. 파일  annotation시켜보기

위와 같이 열리면 성공입니다. 그리고 열어서 아래 그림에 형광펜으로 표시된 tools 부분을 이용하여 annotation을 시킵니다. (병리과 의사들의 경우 annotation을 전체적으로 하지 않고, 부분적으로만 표시해줍니다, 아마 진단시에도 부분적으로 보고 판단하는듯 합니다. 슬라이드 전체를 보고 진단하기에는 인력낭비가 심할듯하구요.. 뇌피셜..)

 

 

2-3. annotation저장 후 확인해보기

 

openslide에서 공개 해놓은 데이터가 ASAP에서 뭔가 저장이 안되는거 보면 잠겨있는 것 같습니다. (뭐 저장이 되신다면 저장된 것을 보시고) 

 

annotation이 저장된 부분을 보게 되면 xml로 이루어져 있습니다.

 

여기까지 의료 이미지 분석에 필요한 데이터를 준비하는 단계를 간단하게 적어 보았습니다.

 

ASAP에서 저장이 안되었던 부분은 추후에 수정하도록 하겠습니다.

 

다음 시간에는 의료이미지에서 annotation을 통해 나온 xml을 이용하여 python으로 annotation해보는 방법에 대해 알아보도록 하겠습니다.

 

 

728x90
반응형

댓글