CT나 MRI와 같은 의료 영상은 사람의 체내 장기를 관찰하고 질병을 진단하기 위해 영상 분석이 필수적으로 요구된다. 특히 체내 장기 중 췌장은 크기가 작고 다른 장기와 연결되어 탐지 난이도가 매우 높다.
따라서 이 논문에서는 다양한 패치 크기의 U-Net 구조를 다중 연쇄 결합(Concatenation)하여 췌장 분할 성능을 향상시킬 수 있는 새로운 MCU-NET(Multiple Concatenated U-Net) 모델을 제안한다.
MCU-Net 모델은 서로 다른 패치 크기를 가지는 U-Net 모델을 연쇄 결합한 구조이다.
탐색이 끝난 곳을 다시 탐색하는 filter sliding 기반 특징 탐색 방식과 달리 패치 기반 탐색 방식은 지정된 간격인 stride만큼 건너뛰면서 입력데이터를 순회하기 때문에 CNN과 달리 중복된 영역에 대한 특징 탐색을 줄임으로써 학습 속도의 향상을 가져왔다.
stride만큼 건너뛰며 탐색하기 때문에 맥락 정보 손실이 일어나는 것을 방지하기 위해 anchor box와 같이 다양한 크기의 패치를 갖는 U-Net 모델을 마지막 단계에서 결합함으로써 영상의 특징을 다양한 관점으로부터 추출하여 정보 손실을 줄였다.

다양한 패치 크기에 의한 결괏값을 동시에 고려했기 때문에 U-Net에 비해 더 많은 context 정보를 얻는다.
입력 이미지(I)를 패치 크기가 서로 다른 n개의 U-Net 중 i번째 U-Net인 Li를 통해 특징 벡터를 입력으로 사용하고 이러한 특징 벡터들을 연결한 특징 벡터인 U를 통해 췌장 영역을 탐지하며 결과 이미지(O)를 출력했다. U를 통해 탐지한 췌장 영역은 softmax를 통해 결과 이미지(O)를 출력했다.

(3,3), (5,5), (7,7)인 U-Net 3개를 결합한 구조이다. 각 convolution에서는 ReLU 활성화 함수를 사용했으며, 수축 경로에서는 2x2 max pooling을 사용했다. 매 계층을 내려갈 때마다 down sampling을 하여 채널 개수를 2배씩 늘렸다. 확장 경로에서는 줄어든 크기를 다시 키우기 위해 2x2 up-convolution을 사용했고, 채널 개수는 반으로 줄였다. 마지막 계층에서는 각 U-Net들을 1x1로 convolution하고 이를 연쇄 결합한다.
채널 개수는 진행된 U-Net의 개수인데, 패치 크기가 다른 3개의 U-Net을 연결했기 때문에 채널 개수는 3이 된다.
손실 함수로는 Dice coefficient를 사용했다.(예측 영역과 실제 영역이 일치할수록 1에 가깝고 일치하지 않을수록 0에 가깝다.)