[Paper Review] Deep learning-based Classification of mesothelioma improves prediction of patient outcome

JaeHeon Lee, 이재헌·2022년 4월 26일
0

Paper Review

목록 보기
7/49
post-thumbnail
post-custom-banner

Deep learning-based Classification of mesothelioma improves prediction of patient outcome

Introduction

Malignant mesothelioma (MM): aggressive cancer of pleural lining. 석면(asbestos)이 원인.
Sarcomatoid MM (SMM)이 결합조직 쪽 암으로 가장 위험. Epithelioid MM (EMM)이 덜 위험. Biphasic (BMM)이 중간.

저자는 MesoNet을 통해 다음과 같은 결론을 얻음.
1) 다른 dataset에 robust하게 적용 가능 (MesoBank → TCGA)
2) without any pathologist-provided locally annotated regions
3) outperform pathologist의 예측보다 survival 예측 잘 나옴.
4) interpretability 측면에서 유의미한 morphological feature 발견함.

Method

U-net을 이용해 tissue segmentation 수행. Tiling 작업 수행 (tile: 224 x 224 pixels). ResNet-50 을 거치고 auto encoder로 reduce dimension 후 1D convolution layer 거침. 이후 상위/하위 몇 개의 tile 들만 MLP input으로 넣어서 최종 survival prediction 나오도록 함.
→ 이전에 CHOWDER 방식과 거의 똑같음.

Data
MesoBank slides 2981 중 training set 2300 slides, test set 681 slides.
TCGA slides 56 for validation set.

Results and Discussion

Comparison study

  • Histo (pathologist provided histology type)
  • Histo/Grade (combining histological type and tumor grade with XGBoost)
  • MeanPool (just averaging not selecting informative patches)

파란색 MesoNet이 TCGA validation set으로 했을 때 outperform.
Showing that MesoNet is robust when applied to an independent dataset

Histological repartition of results from test dataset
Worst prognosis group by MesoNet 이 SMM 34% 밖에 없고 EMM이 40%나 있었음. 이 group과 SMM 만 있는 group으로 KM estimation 했을 때 별 차이 없었음.
또, good prognosis group by MesoNet 에는 EMM만 있었음. 근데 grade가 다양하게 있었음. 그 중 EMM grade 1과 high survival group으로 KM estimation 했을 때 별 차이 없었음.

Output이 continuous risk score 로 표현됨. 이를 기반으로 특정 기준과 함께 나누었을 때,
같은 type과 같은 grade 내에서도 high/low risk를 가진 group이 유의미하게 나뉘었음.

Interpretability

Interpretability 측면에서, MesoNet은 각 tile에 risk score를 할당하다 보니 distribution을 확인할 수 있었음.

환자마다 존재하는 intratumoral heterogeneity를 설명하기 위해 multiple biopsies를 확인하였고, 환자 내에 존재하는 차이보다 inter-individual variability가 유의미하게 큰 것을 확인함.


Distribution에서 low risk group은 negative 쪽으로 치우쳐져 있음을 확인할 수 있었고, high risk group은 positive 쪽으로 distribution shift가 있음을 확인할 수 있었음.

또한, tiles associated with lower survival 는 pleomorphic, atypia and higher-grade regions.
tiles associated with higher survival 는 inflamed, vacuolized and fibrotic patterns 임을 확인함.
대상 tile과 vector of coefficient 와의 similarity 를 계산하여 predictive tile과 non predictive tile을 가져옴.

low survival group의 predictive tile feature는 high survival group의 non-predictive tile feature와 닮았고, 반대로 high survival group의 predictive tile feature는 low survival group의 non-predictive tile feature와 닮아있었음.

Most low survival associated tiles were mainly localized in stromal regions, instead of within the tumors. These tiles were moreover associated with a transitional pattern, a provisional histopathological pattern recently described, corresponding to a higher grade cellular morphology with atypical nuclei, and a characteristic stromal response, consisting of cancer-associated fibroblasts with small vessels unevenly distributed together with inflammatory cells. Other low survival tiles were focused on areas of vacuolated and atypical cells in a dense collagenous stromal response, for which the malignancy of the region cannot be confidently assessed by the pathologist during an initial assessment without immunohistochemistry. We named these tiles ‘tiles of unknown significance’. In contrast, high survival tiles showed a tubular architecture and were well vascularized.

이를 기반으로 최종 결과를 다음과 같이 정리함.

1) Low survival group의 39%가 SMM이었음. 이는 MesoNet이 잘 뒷받침 함.
2) low survival group의 39%가 EMM이고, unknown/transition component가 22% 였음. 이 결과는 pleomorphic pattern과 EMM이 aggressive tumor의 predictor라는 최근 연구결과와 상응함.
3) Low survival group의 76%가 stromal region에서 발생함. 이는 tumor microenvironment (TME)의 중요성을 강조함.

Conclusion

  • selecting image patches: CHOWDER에서 사용했던 방식처럼, CNN을 거쳐 나온 feature을 하나의 risk score로 환원하였고 이 score를 기반으로 distribution을 뽑고 데이터를 정리하며 WSI의 morphological feature까지 explain/interpret 함.

여태 읽었던 논문들과 비교했을 때 데이터의 분석이 가장 꼼꼼하고 잘 정리되어 있다는 느낌을 받았다. 또한 Malignant mesothelioma 라는 특정 cancer에 대해 새로운 모델을 통해 기존 분류 기준 내에서도 또 다른 분류 기준을 세웠다는 점에서 contribution 이 명확하게 와닿았다. 마지막으로 image 정보 이외에 다른 molecular test 정보나 여러 clinical 정보를 활용한 분석까지 진행하여 자체 데이터 (MesoBank)를 받아 사용함으로써 오는 이점을 잘 활용하였다 생각한다.

profile
https://jaeheon-lee486.github.io/
post-custom-banner

0개의 댓글