Deep learning in cancer pathology: a new generation of clinical biomarkers (British Journal of Cancer. 2021)
(https://www.nature.com/articles/s41416-020-01122-x)
이 review paper는 cancer pathology에서 Deep Learning (DL)이 어떻게 임상 바이오마커의 새로운 세대를 탄생시키고 있는지에 대해 리뷰.
추가적으로 2021년 리뷰 논문이긴 하지만 어떤 방향으로 모델의 결과를 보여주는 것이 임상적으로 의미가 있을지 탐구하기.
이 논문의 배경 부분은 암 병리학에서의 딥러닝(DL) 응용과 그 임상적 의의를 탐구하는 데 초점을 맞추고 있음.
The complexity of cancer treatment decisions
Biomarker 임상 응용 ex
Potential of deep learning & Innovation
Importance of histology image
이 리뷰 논문은 딥러닝이 cancer histology 분야에서 어떻게 응용될 수 있는지, 그리고 이러한 연구가 임상 환경에서 어떻게 유익하게 사용될 수 있는지에 대한 명확한 개요를 제공. 또한, clinical setting으로의 성공적인 전환을 위해 필요한 가능한 사용 사례와 후속 조치에 대해 논의함.
Basic and advanced applications of DL in cancer histology


Prediction of genotype and gene expression
딥러닝은 종양 조직의 미세한 모양 변화를 통해 암을 유발하는 유전자 변이의 존재를 신뢰성 있게 탐지할 수 있음을 보여주었다다. 암세포의 핵과 세포질의 질감, 크기 및 형태와 같은 변화뿐만 아니라, 암세포가 주변 non-malignant 세포 (암세포이긴 하지만 분열하지 않는 세포) 에 유발하는 반응을 통해 생기는 두 번째 순서의 형태학적 변화도 포함된다. 이러한 변화는 각각의 암 유발 유전자 변이에 의해 발생하지만, DL을 사용하여 H&E 이미지에서 직접 이러한 유전자의 유전형을 예측할 수 있음이 입증되었다. 예를 들어, 폐선암에서 암 유전형이 조직학적 형태현상에 반영됨을 보여주는 연구가 있었다. 이 연구에서는 특정 유전자 변이(STK11, TP53, EGFR)를 조직학만을 사용하여 예측할 수 있었으며, AUROC 값이 0.85에 이르는 것을 검증했다.
이러한 유전자 변이의 예측은 targeted therapy에 중요하다. 예를 들어, 폐암에서 EGFR의 유전형은 변이된 EGFR 단백질을 표적으로 하는 여러 tyrosine kinase inhibitors (TKI)의 사용을 지시하며, 멜라노마에서는 변이된 BRAF가 세린/트레오닌 키나제 억제제로 직접 표적화된다. 또한, MSI, the genetic correlate of mismatch-repair deficiency (dMMR)의 유전적 상관인 MSI는 immune-checkpoint inhibition therapy 사용을 위한 몇 안 되는 FDA 승인 유전적 바이오마커 중 하나이다. 이러한 변이는 조직학만으로도 위암, 대장암, 자궁내막암에서 신뢰성 있게 탐지될 수 있다.
현재 임상에서 암 조직의 유전적 변화를 탐지하는 것은 IHC, ISH, PCR 또는 차세대 시퀀싱(NGS)과 같은 wet-lab 검사가 필요하지만, 이러한 검사는 비용이 많이 들고 시간이 오래 걸리며, 모든 암 치료 지점에서 사용할 수 있는 것은 아니다. 반면, DL을 기반으로 한 스캔된 조직학 슬라이드 평가는 추가 비용이나 시간이 거의 들지 않는다. 그러나 지금까지 수행된 모든 DL 기반 연구에서, AUROC score는 sample크기에 따라 많이 다르고, wet-lab test의 gold standard에 비해 일관되게 열등했다. (현재는 성능이 어떤지 모르겠네)
Survival prediction through DL biomarkers
딥러닝(DL) 바이오마커를 통한 생존 예측은 종양학의 치료 결정 과정에서 중요한 요소이다. 현재 생존율은 age, gender, cancer stage, pre-existing conditions, genetic alterations and histology risk factors를 통해 추정된다. 이러한 조직학적 위험 요인에는 거의 모든 종양에서 발견되는 tumour cell differentiation, stromal abundance, lymphocyte fraction, lymphatic vessel invasion, vascular invasion, perineural invasion and necrosis 등이 포함된다.
이러한 기존 위험 요인 외에도, 더 높은 수준의 특성들이 예후 정보를 담고 있다. 예를 들어, 림프구의 공간적 배열 분석이나 염색질 질감과 같은 특성은 다양한 종양에서의 생존율 예측 지표로 사용될 수 있다. DL은 이러한 특성을 모두 통합하여 이미지 데이터로부터 직접 생존율을 예측할 수 있는 잠재력을 가지고 있으며, 이는 여러 연구에서 입증되었다.
일부 연구에서는 생존 예측자를 위해 DL 네트워크를 훈련시키기 위해 수동으로 정의된 파라미터를 사용한 반면, 다른 연구에서는 unbiased approach and leave the feature selection entirely to the deep network을 사용했다. 이는 조직 예후 파라미터가 수동으로 식별되거나 추출되지 않았음을 의미함. 이러한 접근 방식은 모두 임상 설정에서 위험 조정 전략의 기반으로 사용되기 위해서는 독립적이고 전향적으로 검증될 필요가 있다. (실제로 요즘 unsupervised learning 많음)
DL 기반 생존 예측을 탐색하는 몇 가지 주요 연구는 다양한 암 유형에서 이루어졌음. 예를 들어, H&E 염색된 조직만을 사용하여 대장암 환자의 5년 질병 특이적 생존율을 예측하는 것이 가능함을 보여준 연구가 있었고, 또한, 조직 분류를 통한 OS예측을 통해 기존 방법보다 개선된 생존 예측이 대장암 환자에서 입증되었다.
그러나 아직까지 DL 기반 생존 예측을 임상 워크플로우에 통합한 임상 종단점 연구는 없으며, 다른 예후 바이오마커를 사용한 대규모 전향적 시험은 평가되었지만 DL 문헌에서는 이러한 수준의 증거가 여전히 부족. DL 기반 테스트가 임상 의사 결정에 직접적인 영향을 미치고 새로운 치료 개발 목표를 식별하는 데 도움이 될 수 있는 잠재력을 가지고 있음에도 불구하고, 이 분야는 여전히 초기 단계. (점차 많아지고 있음)
End-to-end response prediction directly from histology
DL을 이용한 치료 반응 예측은 다양한 암 유형에 대한 표적 치료 옵션의 증가와 함께 중요해지고 있다. 많은 치료법이 특정 환자 집단에서만 효과적이며, 반응하지 않는 환자들에게는 상당한 부작용을 일으킬 수 있음. 예를 들어, cancer immunotherapy은 멜라노마와 폐암 치료 분야를 혁신적으로 변화시켰지만, 여전히 이러한 종류의 종양을 가진 환자의 약 절반은 의미 있는 반응을 보이지 않는다. DL은 치료에 대한 긍정적 반응의 예측 마커로 사용될 수 있는 종양 조직 내의 구조와 변화를 탐지하는 데 핵심적인 역할을 할 수 있으며, 따라서 반응하는 환자를 식별하고 비반응자에 대한 부정적인 영향을 최소화하는 데 도움이 될 수 있다.
DL을 일상적인 조직학 이미지에 적용하여 긍정적인 예측 마커를 탐지/식별하는 두 가지 잠재적 방법이 있다.
첫째, DL은 이미 치료 접근법의 대상이거나 치료 반응의 대리인으로 알려진 특성, 변이, 호르몬 수용체 상태 또는 유사한 분자 변화를 식별할 수 있다. 이 접근법은 환자를 더 빠르고 정확하게 최적의 치료 체계에 할당하는 데 도움이 될 수 있다.
또한 조직 슬라이드로부터 직접 치료 반응을 예측하는 데 사용될 수 있다. 이 end-to-end workflow는 특정 치료 반응 유형이 알려진 대규모 환자 코호트에 대해 DL 네트워크를 훈련시키는 것을 요구. 하지만 이러한 이미지 데이터는 쉽게 얻을 수 없기 때문에, 이를 조사한 연구는 많지 않음.. 특히, 멜라노마 환자를 ipilimumab에 대한 반응자와 비반응자로 분류한 연구, 그리고 H&E 염색 이미지로부터 직접 NSCLC 환자의 면역요법에 대한 반응을 예측하는 연구가 있었지만, 이 연구들은 소규모 환자 수를 포함하고 있으며, DL이 치료 반응을 예측하는 잠재력이 아직 완전히 활용되지 않았음. 생존 예측과 유사하게, 치료 반응 예측은 조직학 이미지에서 새로운 형태학적 마커의 탐지로 이어질 수 있으며, 이는 새로운 치료 전략의 개발로 이어질 수 있음. (내가 생각했을 때도 가장 중요한 전략, 사업적으로도 진단하기에 가장 많은 비용이 드는 부분이기에..)
DL-based mutation prediction for pre-screening or definitive testing
DL 기반 바이오마커는 임상 워크플로우에 두 가지 주요 방식으로 통합될 수 있다.
환자의 유전자 검사 전 사전 선별이나 결정적 검사를 위한 변이 예측이다.
대부분의 암 유형에 대한 임상 워크플로우는 치료를 조정하기 위해 분자 검사에 의존하고 있지만, 실제 제한으로 인해 보편적인 검사는 불가능하다.
DL 기반 유전자형 판정은 이러한 워크플로우에서 환자를 유전자 검사 전에 사전 선별하는 데 사용될 수 있거나, 기존 방법을 완전히 대체하여 결정적 검사로 사용될 수 있다. 이 경우, 매우 높은 검사 성능이 요구된다. DL에 대한 증명 개념 연구는 대체로 0.70–0.90 범위의 AUROC 값을 보고했으며, 이는 확실히 결정적 검사에 필요한 것보다 낮지만, 드문 특성의 환자를 사전 선별하는 데 유용할 수 있음.
Moving towards clinical approval: where are we now?
DL의 임상 승인 방향은 아직 초기 단계에 있으며, 방사선학 분야에 비해 조직병리학에서의 응용은 천천히 진행되고 있다. 그러나, 연구 환경은 기술 중심에서 벗어나 점점 더 임상적으로 관련된 문제와 과제에 초점을 맞추고 있다. 일부 DL 개념은 규제 기관으로부터 승인을 받고 임상에 적용되기 시작했지만, 조직병리학 이미지 분석에서 FDA 승인된 절차는 기본 DL 응용에 국한되어 있다.
DL 조직학을 임상에 널리 도입하기 위해서는 표준화가 필요하고 임상에서 사용될 수 있을 만큼의 성능을 더욱 개선해야 함.
Moving towards end-to-end systems
End-to-end DL 시스템은 특정 치료에 대한 반응을 직접 예측하려는 대안적 접근 방식으로 제안되었다. 이는 유전적 바이오마커가 치료 반응을 예측하는 대리 지표로 사용될 수 있지만, 모든 경우에 완벽한 예측 값을 제공하지는 않는다는 인식에서 출발.
예를 들어, HER2의 변이나 over expression은 유방암에서 트라스투주맙에 대한 긍정적인 반응을 예측하지만, 다른 분자 바이오마커들은 그렇게 명확하지 않다. End-to-end 시스템은 특정 치료 유형에 초점을 맞추지 않고 조직학 이미지만을 바탕으로 개별 환자의 생존율이나 치료 반응을 예측할 수 있는 잠재력을 가지고 있으며, 이론적으로는 미리 정의된 예측 파라미터에 집중하지 않고 조직학 이미지로부터 직접 결과를 예측할 수 있기 때문에 분자 예후나 예측 바이오마커보다 더 우수한 성능을 발휘할 수 있다.