N-staging은 therapeutic strategies를 평가하고 결정하는 데에 중요한 요소임. AJCC N-staging system은 number of metastatic LN을 이용해 three stages로 나누었음. 하지만 prognostically meaningful 하려면 최소 15개의 resected LN이 필요하지만 기술적으로 불가능할 때가 많음. 또한 같은 N stage로 분류되더라도 예후가 dramatically vary한 경우가 많음.
저자는 metastatic lymph node (MLN)을 segmentation model로 분리하고 classify한 뒤, 계산한 tumor-area-to-MLN-area ratio (T/MLN)로 예후 분석을 진행함. Pathologist가 놓치던 micrometastases 를 잡을 뿐만 아니라, 시간 절약과 reproducible한 quantification이 가능함을 확인함. 기존 stage 방식 등을 적용한 subgroup 내에서도 진행하여 risk stratification을 확인함.
다음과 같은 세 cohort 로부터 training, validation을 진행함.
sampling 후 label이 붙은 slide로 training (segmentation, classification)을 거치고, T/MLN을 계산하여 추가 분석을 진행함
three-phases로 구성되어 있음: segmentation, classification, T/MLN calculation
Segmentation
1x magnification thumbnail로 U-net architecture에서 학습함.
(cropped images to 700 x 700 pixels, used random cropping and rotation)
1321개의 LN을 포함한 700개의 marked WSI로 학습을 진행한 결과
Mean Jaccard index 95.8%, mean Dice score 98.6%.
Probability 형태 output을 통해 heatmap을 그렸음.
Classification
여러 model을 기반으로 classification을 진행했고, ResNet-50이 시간 대비 성능 면에서 우수해 선정됨.
Validation set에서 mean Dice score 94.4%, patch-level area AUC score 0.990, slide-level AUC (nodal metastasis: present or absent) 0.986, average free ROC score 0.872 를 기록함.
WSI cut 768 x 768 patch consists of nine 256 x 256 patches.
Calculation of T/MLN
T/MLN = 1/m * sum(tumor area / MLN 전체 area), m: MLN 개수
Pixel 개수를 기준으로, proportion of tumor component를 계산함.
2mm 보다 작은 diameter를 가진 micrometastases도 잡아내는 것을 확인함.
AI only 와 기존 clinician 결과, AI-assisted analysis 와 기존 clinician 결과를 비교함.
AI only: accuracy 96.9%, sensitivity 98.5, specificity 96.1%
AI assisted 에서 6.8% (360 / 5299) 의 MLN이 original diagnosis 이외에 추가로 발견되었고,
1.8% 만이 only AI diagnosis에서 놓쳤다. (high sensitivity)
4.6% (43 / 857)의 MLN이 micrometastases 의 형태로써 pathologist가 under-stage 되었다.
AI assisted analysis와 manual estimation 을 T/MLN 별로 비교했을 때, 50% 이상은 거의 비슷하고 5-50% 는 slightly better 였으며, 5% 미만 T/MLN 을 가진 것은 훨씬 성능이 좋음. (much better)
Time effort: pathologist 3-15 min, AI-assisted pathologist: 2-6 min needed.
LN analysis output인 T/MLN을 prognostic prediction에서 사용함.
N stage 별, T/MLN (high/low) 별로 group을 나눈 KM estimation 결과:
모두 significant difference 가 존재했음.
같은 stage 내 (특히 N2 stage, N3 stage) 에서도, T/MLN 값이 varies significantly from patient to patient. Ranging from 5-100%
Hypothesis: that there may be T/MLN-specific differences in prognostic power.
이를 위해 univariate cox regression analysis (기준은 median T/MLN 0.45)를 진행함.
그 결과 T/MLN (>0.45) was correlated with poor outcome (hazard ratio [HR] = 2.05, 95%
confidence interval [CI] 1.66–2.54, P < 0.001)
또한 independent prognostic ability of T/MLN을 계산하기 위해 multivariable analysis 진행.
(T/MLN, N stage, histologic grade, age, size, histological type, Lauren type, pathological tumor stage, surgery type, blood transfusion, location and sex)
그 결과 HR of 1.39 and a 95% CI of 1.10–1.75 (P = 0.007)
N-stage subgroup 내에서 cancer specific survival analysis 를 진행한 결과, higher T/MLN이 shorter than lower T/MLN. (N1 stage: HR = 2.23, 95% CI 1.29–3.85, P < 0.001; N2 stage: HR = 1.65, 95% CI 1.12–2.43, P = 0.005; N3 stage: HR = 1.55, 95% CI 1.15–2.09, P = 0.020)
→ T/MLN can provide patients with more prognostic information based on N-staging
기존 연구 결과 N3 stage가 다시 세분화 되어 N3a, N3b 로 묶였었고, 이 subgroup 내에서 동일 실험 결과 low T/MNL patient 에서 poor outcome이 나오는 것을 확인함. (HR = 1.47, 95% CI 1.06–2.04, P = 0.021) N3b는 significance를 얻지 못했고, 이는 표본 수의 부족이라 설명함. (HR = 2.13, 95% CI 0.83–5.45, P = 0.108)
Micrometastases 가 좋은 prognostic value인지 확인하기 위해, 실험을 진행함.
C-index 결과 N stage only < N stage + micrometastasis < N stage + T/MLN 로, the area of tumor cell clusters does reflect the degree of metastasis.
CH hospital 2006-2008 GC cohort (214 case, 2044 WSI, 4343 LNs)
JX hospital 2016-2019 GC cohort (92 case, 904 WSI, 2260 LNs)
Transfer learning 없이 performance of framework remained satisfactory
CH hospital 2006-2008 cohort AI only: sensitivity 97.9%, specificity 86.3%
JX hospital 2016-2019 cohort AI only: sensitivity 96.0%, specificity 85.1%
WSI standardization을 거친 결과 더 괜찮은 결과를 얻음.
다음 두 가지 question을 증명하여 T/MLN의 clinical practice에서의 사용이 가능하다 주장함.
Limitation: from one nation → cloud based platform으로 extend amount of data availablity..
tumor segmentation: segmentation network를 통해 adipose tissue와 같은 outside lymph node (non-target) area를 제외하였고, 나머지를 tumor classification model로 구분하여, 예후 분석을 진행함.
꼼꼼한 분석..