AIS(Acute Ischemic Stroke)는 치료 가능한 시간이 매우 짧다. AIS의 lesion을 찾기 위해 딥러닝 기반의 segmentation 알고리즘들이 제안 되었지만 fully-labeled data를 얻는 것과 정확하게 annotation을 하는 것이 매우 어렵다. 460개의 weakly-labeled subjects와 5개의 fully-labeled subjects를 이용한 semi-supervised learning 방법을 제안하였다. 그리고 150개의 subjects에 테스트를 진행하였다.
Stroke는 ischemia와 hemorrhage로 나뉜다. 그 중 ischemic stroke는 87%를 차지한다. 치료 결과를 개선하기 위해 acute stage에서 신속하게 진단하고 정량적으로 평가하는 것이 가장 중요하다. ischemic stroke를 진단하기 위해서 MRI를 많이 사용한다.
DWI와 ADC map 둘다 사용하는 것이 AIS lesion을 찾는데 용이하다. 위 그림에서 노란색 화살표가 lesion이 아님에도 hyperintense가 나타난 부분이며 빨간색 화살표가 AIS lesion이다.
weakly-labeled subjects는 AIS lesion의 유무 만으로 annotation을 하여 수고를 덜었다. Weakly-labeled subjects를 사용해 classification CNN 모델을 얻음으로 AIS lesion의 CAM(Class Activation Map)을 얻을 수 있다. 하지만 CAM에서 얻는 영역은 AIS lesion에 비해 상당히 큰 영역이라 정교하지 못하다.
이를 보완하기 위해 본 논문에서는 double-path 방식으로 학습되는 DPC-Net을 제안하였다. DPC-Net에서는 K-means 알고리즘이 사용된다. DWI에 fully-labeled subjects로 부터 얻은 parameter와 CAM을 통해 segmentation map을 얻는다.
학습은 double-path 방식으로 진행된다. DWI, ADC를 channel-wise-concatenate 하여 입력으로 들어가 학습한 DPC-Net에서 CAM을 얻는다. 그리고 CAM 정보를 이용해 DWI에서 K-means 알고리즘을 거쳐 segmentation map을 얻는다. 이 때 region-growing 알고리즘이 사용된다. 제안 된 알고리즘은 weakly-label을 사용함으로 semi-supervised learning 시 fake label로 인한 성능 저하 문제가 발생하지 않는다.
DPC-Net은 VGG-16 모델을 기반을 하고 있다. Convolution block 7이 input image에 비해 probability map을 뽑기에 좋지 않기 때문에 GAP(Global Average Pooling)과 FC(Fully Connected layer)을 추가하여 보완하였다. 그리고 convolution block 7 옆에 GAP와 FC를 추가하여 convolution block 4의 spatial resolution을 높였다.
CAM은 convolution block 7과 4로 부터 얻은 M1, M2를 통해 얻어진다.
얻는 과정은 위와 같다.
K-means 알고리즘은 pixel intensity에만 focus를 하고 있다. 하지만 본 논문에서는 DWI로 부터 얻는 AIS lesion에 대한 priori knowledge와 region growing 알고리즘을 사용하여 보완하였다. Region growing 알고리즘의 growing points는 DPC-Net의 output으로 부터 얻을 수 있다.
알고리즘 순서는 다음과 같다.
본 논문에서는 pixel-level segmentation 평가 지표로 DC(Dice Coefficient)를 제안하였다.
G는 ground truth, P는 predicted를 상징한다.
실험 데이터는 Tianjin Huanhu 병원의 AIS lesion이 있는 환자들의 데이터를 사용하였다. ADC map은 아래 식을 통해 계산된다.
는 diffusion-sensitizing gradient pulses를 나타내며 , 이다.
은 일 때의 diffusion-weighted signal intensity이고 는 일 때의 signal with no diffusion gradient이다.
MR image를 192x192로 linear interpolation을 이용해 resample하였다. 그리고 MR image의 pixel intensity는 zero mean과 unit variance로 normalize 하였다. DWI와 ADC slice는 concatenate하여 dual-channel image로 만들어 DPC-Net의 input으로 들어가게 된다.
특히 각각의 image는 무작위로 1 ~ 360도 사이로 회전이 되며 수직, 수평으로 flip이 된다.
학습에서 460개의 weakly-labeled subjects와 5개의 fully-labeled subjects가 사용되었다. 그리고 fully-labeled image는 K-means 알고리즘의 threshold와 cluster 개수 K를 설정하는데 사용되었다.
제안 된 semi-supervised 방법은 MR image segmentation에서 높은 정확도를 보여줬다. Dice coefficient는 0.642이고 precision은 0.880이 나왔다. 게다가 제안 된 방법은 fully-labeled subjects를 얻는 수고를 덜어 줌에 의의가 있다.