2022 10월에 나온 논문
missing modalities를 해결하는 방법은 총 3가지로 나눠진다.
하지만 다중 모달 특성 간의 상관 관계를 포착하기 어려움
=> 모달리티 간의 정보를 명시적으로 포착하기 위해 spatial-frequency jointly modality contrastive (SFMC) learning scheme를 제안 (MD stage에서)
(전에는 공간만 쓰거나, 주파수 도메인만 쓰거나, 독립적 기능을 분리했지만 성능이 부족함)
이 스키마는 self-supervised learning으로 공간 및 주파수 도메인을 모두 사용하여 모달리티별 정보에 대한 명시적으로 나타내기 가능. 누락된 모달리티 상황에 모달리티 불변 내용 보존 가능
Dual disentanglement framework(D2net) consisting of the MD-Stage and TD-Stage
MD-Stage: 모달리티별 정보 분리, 이용
TD-Stage: MRI 모달리티와 관련이 없는 분리된 종양 특정 지식을 생성
Disentanglement Representation learning
주로 비지도 학습에서 연구 되어 옴
1. GAN
GAN 모델을 활용하여 잠재 공간에서 정보를 모델링하는 것, 단점: 수렴 어렵고 하이퍼파라미터에 민감함
2. encoder-decoder framework 기반으로 독립된 잠재변수 학습
ex. Variational Auto-Encoder (VAE)
=> 둘다 명시적인 지도가 부족하며 성능이 안 좋음
이중해체 네트워크 D2-Net을 제안함, 모달리티별 정보 해체 단계 (MD-Stage)와 종양별 영역 해체 단계 (TD-Stage)로 구성되어 있음
2018 brats 데이터셋 사용, 모달리티: FLAIR, T1, T1ce, T2
분할 성능 평가: WT (배경을 제외한 모든 영역의 합), TC (네크로틱, 비강화 및 강화 종양의 합), ET (강화 종양) 영역
train: 190개, validation: 95개, 3개의 fold로 cross validation 함
랜덤으로 입력 모달리티 삭제하면서 end-to-end 방식으로 train
WT, TC, ET에 대한 평균 Dice score에서 76.2%, 66.5%, 42.3%의 최고 성능을 달성
여러 모달리티들이 누락되어도 성능이 좋음
D2-Net이 주로 T1ce 모달리티에 의존하므로 T1ce 모달리티가 누락되면 성능이 안
좋을수도 있음.