최근 연구결과 African American 에게서 aggressive cancer이 발병할 확률이 높다는 증거가 쌓이고 있지만, 기존 recurrence risk prediction model 은 population-specific phenotype을 반영하지 않음.
본 논문에서는 intratumoral stroma region에서 stromal feature 를 계산하였고, CA validation set 과 달리 AA validation set에서만 prognostic 하다는 결과를 얻음. 또한 추출한 stromal feature와 현존하는 여러 tumor biomarker 와의 correlation 을 분석하였음.
334 patients were divided into three cohort
V_T : training, n=127
V_1 : validation 1, n=62
V_2: validation 2, n=145
모든 slide는 40x magnification으로 스캔되었음.
기존 연구된 두 개의 CNN model을 사용하여, pixel 단위의 confidence map을 얻음.
1) Each pixel in the image was part of a nucleus
2) Each pixel in the image belonged to the stroma
https://doi.org/10.4103/2153-3539.186902
“Boundary coordinate” 을 이용하여 CNN model output인 stromal nuclei 및 stromal compartment 으로부터 242 개의 quantitative histomorphometric (QH) image features를 계산함.
Stromal texture, global and local connectivity graphs of stromal nuclei, nuclear centroids, and descriptors of nuclear shape and orientation 이 포함되어 있음.
(a-d) Voronoi Diagrams, (e-h) minimal spanning trees, (i-l) directionality color maps, (m-p) global graphs for stromal nuclei.
IHC stain intensity H-score for 10 biomarkers 를 얻음. (V_T,AA / V_1,AA)
TMPRSS2-ERG fusion, PTEN, PMSA, Racemase (AMACR), C-MYC, AR, Ki-67, P-53, RB
Racial subset of V_T (V_T,AA / V_T,CA / V_T,AA+CA) 내에서 Pearson correlation coefficient (PCC 를 계산함. 이 feature 중에 0.9 보다 낮은 feature pair 중 absolute Beta value가 낮은 feature를 제거.
Clinicopathologic features of the patient datasets
Training set 과 validation set 사이에 유의미한 feature distribution 차이가 없음을 “Wilcoxon rank sum test” 로 분석함.
Image로부터 뽑아낸 feature의 prognostic capability를 구하기 위해, V_T 데이터셋로 univariate COX model 을 학습함.
V_T,AA+CA : 15 uncorrelated (PCC<0.9) stromal image features were prognostic
V_T,AA: 6 features were prognostic, exhibited dramatic hazard ratios
V_T,CA: 22 features were prognostic, mostly associated with shape and texture
Random forest and ENC models 이 사용됨.
Input number of feature를 1-25로 돌리고 3-fold CV 10회 iteration 평균냄 (in V_T).
V_T 내부에 3개의 cohort 각각에서 highest significant HR을 가진 hyperparameter 저장.
이를 lock down하고 V_1, V_2 에서 AUC, KM estimation, univariate COX model HR, p value 계산함.
6개의 feature에 대해 train한 RF model을 V1, V2 AA set에서 성능을 계산함.
V1 : AUC of 0.85 and HR of 3.03 [95% confidence interval (CI), 0.812–11.3; P = 0.024]
V2 : AUC of 0.75 and HR of 4.51 [95% CI, 0.925–22; P = 0.013]
Survival data로 regression model을 학습하여 recurrence risk score를 산출함.
1) 각 patient로부터 얻은 risk score를 20th - 80th percentile로부터 candidate threshold 뽑음.
2) 각 candidate threshold 를 설정해 training set에서 log-rank p value와 HR을 계산함.
3) highest significant HR 를 가진 threshold 가 선정됨.
--> 이를 holdout 하고 각 cohort의 validation set에서 성능이 측정됨.
10개의 descriptors of stromal morphology로 train한 ENC model을 V1, V2 AA model에서 test.
V1 : AUC of 0.87 and HR of 4.71 [95% CI, 1.65–13.4; P = 0.0027]
V2 : AUC of 0.77 and HR of 5.7 [95% CI, 1.48–21.90; P = 0.014]
ENC model에서의 결과는 both dataset에서 outperform RF models.
→ 추후 분석은 ENC model을 이용해 진행됨.
AAstroENC model 으로 계산된 risk score가 independent prognostic factor인지를 multivariate Cox PH model으로 확인함.
HR 4.62, 2.57로 significant 했으며 이외의 covariate 중 “presence of SVI” 만이 significant 했음.
postoperative biochemical recurrence nomogram인 Kattan nomogram과 CAPRA-S nomogram.
결과 AAstroENC classifier model이 두 nomogram을 두 dataset에서 outperform 함.
Stromal image feature가 다른 tumor biomarker 와 correlation이 있는지 확인하기 위해, 여러 biomarker IHC 으로 계산한 H-score와 stromal morphological feature 간의 Pearson’s correlation coefficient (PCC) 를 계산함.
총 29개의 pair가 significance를 가짐과 동시에 absolute PCC 값이 0.4 이상이었음.
그 중 biochemical recurrence risk 에 prognostic한 3개의 pair는 다음과 같음.
PTEN 은 15 feature와 statistically correlate 했고, 그 feature 는 모두 nuclear shape 관련이었음.
Absolute PCC 가 가장 높은 feature는 PTEN 과 mean Fourier descriptor 4 of stromal nuclear shape (PCC=-0.623, P=7.56e-3) 이었음.
Prostate cancer pathogenesis 관련 biomarker 발현 지수와, stromal morphological feature 간의 상관관계가 있을 것이라 가정하고 연구를 수행함.
Limitation
AA에선 뽑아낸 feature가 작동하고 CA에선 작동하지 않는 것을, AA만의 특징으로 잡았지만, CA의 data가 부족해서 생기는 차이일 수 있음.
BCR “CA” patients의 follow up duration이 상대적으로 짧았음.
기존 segmentation model로 intratumor stroma region을 잡고, boundary coordinate로 morphological feature를 계산함. 이 feature는 AA에서 predictive 했지만 CA 에선 그렇지 않았음. AA patient에서 나쁜 예후를 보인다는 연구결과와 함께, 이 feature는 AA의 poor outcome과 관련있을 것이라는 주장과 함께, IHC biomarker과 feature의 correlation을 통해 분자 생물학적 근거를 제시함.
재밌다!