Mei, Lanzhuju, et al. "Clinical knowledge-guided hybrid classification network for automatic periodontal disease diagnosis in X-ray image." Medical Image Analysis 99 (2025): 103376.
Clinical knowledge-guided hybrid classification network for automatic periodontal disease diagnosis in X-ray image 논문 링크
OVERVIEW
- 문제 정의
- 기존 연구는 Clinical Gold Standard와 불일치하는 등 정확한 진단을 내리기 부족함
- 제안 방법 : 치아 수준과 환자 수준을 모두 고려하는 하이브리드 분류 프레임워크
- Tooth-level 분류 : 치아 탐지 + 개별 치아 질환 확률 계산
- Patient-level 분류 : 전체 X-ray에서 환자 단위 예측 + CAM 학습
- 임상 지식 결합 : 임상 규칙 + adaptive noisy-OR gate로 최종 진단
- 의의 및 한계
- 임상 기준을 GT로 사용 → 기존 한계 극복
- Dual branch 구조로 신뢰도 상승
Introduction
- 정확한 치아 진단에서는 probing을 사용
- 기존 연구에서 사용된 치아 X-ray는 병변이 미세하여 식별 난이도 증가
- Panoramic X-ray는 3D 정보 부족 및 왜곡 발생
- X-ray의 단순 골 손실 추정만으로는 Clinical Gold Standard와 불일치
⇒ 해당 문제를 해결하기 위해 HC-Net이라는 새로운 프레임워크 제안
Periodontal disease classification
- panoramic X-ray Image를 사용한 예측이 주 : panoramic X-ray는 3D 정보 부족 및 왜곡 등의 문제 + 정확한 annotation 부족
- CNN, Multi-task framework 등을 적용
→ 단, radiographic annotation에 의존하여 probe를 사용한 진단보다 정확하지 않음
Medical image classification
- CNN : 계층적 특징 학습 가능 → 의료 영상 분류에 자주 사용
- Multi-instance Learning : label이 존재하는 bag 단위 데이터를 통해, 개별 인스턴스의 특징을 학습하여 bag 전체의 분류를 수행하는 학습 방법
Method & Data
Data
- 481 panoramic X-ray
- pixel level annotation (tooth segmentation)
- probing measurement (clinical gold standard)
- label : Health, Gingivitis, Stage I, Stage II, Stage III, Stage IV
- tooth level annotation : 치아 단위 labeling 존재
- patient level annotation : 환자 단위 labeling 존재
- classification task
- Positive : Stage II, Stage III, Stage IV (1)
- Negative : Health, Gingivitis, Stage I (0)
Method

X-ray image를 가지고 치아 수준 및 환자 수준을 모두 고려하여 치주 질환을 가질 확률을 예측
-
Tooth level에서 각 치아의 질환 확률 값이 0.3 보다 작은 경우 healty, 0.7보다 큰 경우 Disease 존재라고 판단
- 모든 치아가 healty → Negative
- 2개 이상의 치아가 Disease → Positive
-
위 2가지 경우에 속하지 않으면 Patient level을 고려

- Adaptive noisy-OR gate 활용
- tooth intensity : CAM에서 각 치아 영역을 고려해 만든 병변 강도 (픽셀 단위)
- dummy probabilities[D] : 각 치아마다 intensity 값을 pooling 하여 만든 치아별 확률 (학습 가능)
- dummy probabilities와 (1-Tooth-Level probabilities[T]) 값을 곱해 누적
- 최종 계산 값은 질환 확률이 높을 수록 1에 가까워짐 : noisy-OR gate는 치아 중 하나라도 병변일 확률이 높으면 전체 질환 확률이 높아짐
Result
1. comparison

H-Net은 HC-Net에서 임상 지식을 제거한 모델
- HC-Net이 가장 높은 성능을 보임
- 단순 CNN base보다 치아 patch 단위로 학습해 미세한 특징을 정확히 학습
2. CAM

- 일반 모델과 비교했을 때 H-Net이 치아 영역을 세밀하게 탐지
3. Ablation studies

- B-Net : 환자 단위 분류만 수행
- T-Net : 치아 단위 분류를 모아서 환자 단위 예측(Voting)
- M-Net : 환자 단위 분류 + CAM 기반 multi-task 학습
- H-Net : 치아 단위 분류 + 환자 단위 분류 + adaptive noisy-OR → hybrid classification 수행
- HC-Net : H-Net + 임상 지식 통합
- Multi-Task 전략 사용 시 질환 영향 영역 인식 성능 증가 : 전체 성능 향상
- 국소적, 전역적 level 의 정보를 병합 : 인식 난이도가 있더라도 질환을 명확히 구분
- 임상적 지식 통합 시 낮은 신뢰도를 가진 치아 예측을 필터링 가능
Conclusion
- 기존에 사용한 간접적 측정 지표인 bone loss 대신, 실제 임상 진단 데이터를 GT로 사용해 임상 기준과 차이가 존재하는 문제 해결
- Dual Branch Classification을 통해 국소적, 전역적 특징을 학습 및 추출하고 실제 임상 진단 절차를 추가하여 예측 신뢰도 상승
- 질병이 초기 단계인 경우 질환을 정확히 탐지하는 것이 어려움
- 임상 지식 반영
- 간단한 임상 지식을 반영해 설계하여 성능을 높인 점이 유의미
- local + global
- 전체적인 판단과 국소적인 영역의 판단을 모델에 제공하여 동시에 사용
- 세밀한 부분까지 상호작용하며 예측에 활용할 수 있음
- Multi-task 전략
- CAM 기반 multi-task 구조가 모델의 설명성을 높여 의학적 해석 가능성을 상승시킴
- 공간 정보 융합
- 3차원 공간 정보까지 포함하여 다양한 정보를 Fusion 하는 경우 성능이 상승할 가능성이 높아 보임
- 임상 지식 전이
- 의사의 경험적 지식을 얼마나, 또 어떤 방식으로 모델에게 전이할 수 있을지가 앞으로 중요한 과제일 것이라 추측됨