Clinical knowledge-guided hybrid classification network for automatic periodontal disease diagnosis in X-ray image

BITLAB·2025년 9월 6일

CV(Computer Vision)

목록 보기

1/1

Mei, Lanzhuju, et al. "Clinical knowledge-guided hybrid classification network for automatic periodontal disease diagnosis in X-ray image." Medical Image Analysis 99 (2025): 103376.

Clinical knowledge-guided hybrid classification network for automatic periodontal disease diagnosis in X-ray image 논문 링크

OVERVIEW

문제 정의
- 기존 연구는 Clinical Gold Standard와 불일치하는 등 정확한 진단을 내리기 부족함

제안 방법 : 치아 수준과 환자 수준을 모두 고려하는 하이브리드 분류 프레임워크
- Tooth-level 분류 : 치아 탐지 + 개별 치아 질환 확률 계산
- Patient-level 분류 : 전체 X-ray에서 환자 단위 예측 + CAM 학습
- 임상 지식 결합 : 임상 규칙 + adaptive noisy-OR gate로 최종 진단

의의 및 한계
- 임상 기준을 GT로 사용 → 기존 한계 극복
- Dual branch 구조로 신뢰도 상승

Introduction

정확한 치아 진단에서는 probing을 사용
- 기존 연구에서 사용된 치아 X-ray는 병변이 미세하여 식별 난이도 증가
- Panoramic X-ray는 3D 정보 부족 및 왜곡 발생
X-ray의 단순 골 손실 추정만으로는 Clinical Gold Standard와 불일치

⇒ 해당 문제를 해결하기 위해 HC-Net이라는 새로운 프레임워크 제안

Periodontal disease classification

panoramic X-ray Image를 사용한 예측이 주 : panoramic X-ray는 3D 정보 부족 및 왜곡 등의 문제 + 정확한 annotation 부족
CNN, Multi-task framework 등을 적용

→ 단, radiographic annotation에 의존하여 probe를 사용한 진단보다 정확하지 않음

Medical image classification

CNN : 계층적 특징 학습 가능 → 의료 영상 분류에 자주 사용
Multi-instance Learning : label이 존재하는 bag 단위 데이터를 통해, 개별 인스턴스의 특징을 학습하여 bag 전체의 분류를 수행하는 학습 방법

Method & Data

Data

481 panoramic X-ray
- pixel level annotation (tooth segmentation)
- probing measurement (clinical gold standard)
  - label : Health, Gingivitis, Stage I, Stage II, Stage III, Stage IV
  - tooth level annotation : 치아 단위 labeling 존재
  - patient level annotation : 환자 단위 labeling 존재
- classification task
  - Positive : Stage II, Stage III, Stage IV (1)
  - Negative : Health, Gingivitis, Stage I (0)

Method

X-ray image를 가지고 치아 수준 및 환자 수준을 모두 고려하여 치주 질환을 가질 확률을 예측

Tooth-Level
- tooth instance segmentation
  - 치아 center point 검출 → 치아 bounding box 예측
  - 치아 center point 검출 → 치아 binary mask 예측
- tooth-level classification
  - 치아 image patch 추출 (image + mask)
  - 사전 학습 Encoder로 feature extraction
  - MLP → 해당 치아가 positive일 확률 예측
Patient-Level Classification
- Multi-task 전략
- 전체 X-ray Image → 사전학습 Encoder → MLP : 환자 수준의 질환 예측 (Classification)
- 전체 X-ray Image → 사전학습 Encoder → Decoder → CAM 추출 : 병변 가능성이 높은 영역에 주목할 수 있도록 함 (Regression)
  - 추후 fusion 시 CAM을 tooth intensity 측정에 사용
  - CAM의 GT는 Distance map을 사용함
  - 치주 질환이 있는 치아를 기준점으로 설정해, 다른 모든 픽셀과 기준점 사이 유클리드 거리로 Distance map을 제작
Clinical Knowledge-Guided Fusion Strategy
- 임상 진단에서 따르는 규칙에 기반하여 치아, 환자 수준의 예측을 병합
  - 모든 치아가 확실하게 healthy인 경우, 해당 환자는 치주 질환이 없음
  - 최소 두 개 이상의 치아가 치주 질환으로 확실하게 진단된 경우, 해당 환자는 치주 질환자
  - 기타 다른 경우에는, 치과의사는 X-ray 이미지의 전체적인 패턴을 고려하여 진단

Tooth level에서 각 치아의 질환 확률 값이 0.3 보다 작은 경우 healty, 0.7보다 큰 경우 Disease 존재라고 판단
- 모든 치아가 healty → Negative
- 2개 이상의 치아가 Disease → Positive
위 2가지 경우에 속하지 않으면 Patient level을 고려
- Adaptive noisy-OR gate 활용
  - tooth intensity : CAM에서 각 치아 영역을 고려해 만든 병변 강도 (픽셀 단위)
  - dummy probabilities[D] : 각 치아마다 intensity 값을 pooling 하여 만든 치아별 확률 (학습 가능)
  - dummy probabilities와 (1-Tooth-Level probabilities[T]) 값을 곱해 누적
  - 최종 계산 값은 질환 확률이 높을 수록 1에 가까워짐 : noisy-OR gate는 치아 중 하나라도 병변일 확률이 높으면 전체 질환 확률이 높아짐

Result

1. comparison

H-Net은 HC-Net에서 임상 지식을 제거한 모델

HC-Net이 가장 높은 성능을 보임
단순 CNN base보다 치아 patch 단위로 학습해 미세한 특징을 정확히 학습

2. CAM

일반 모델과 비교했을 때 H-Net이 치아 영역을 세밀하게 탐지

3. Ablation studies

- B-Net : 환자 단위 분류만 수행
- T-Net : 치아 단위 분류를 모아서 환자 단위 예측(Voting)
- M-Net : 환자 단위 분류 + CAM 기반 multi-task 학습
- H-Net : 치아 단위 분류 + 환자 단위 분류 + adaptive noisy-OR → hybrid classification 수행
- HC-Net : H-Net + 임상 지식 통합

Multi-Task 전략 사용 시 질환 영향 영역 인식 성능 증가 : 전체 성능 향상
국소적, 전역적 level 의 정보를 병합 : 인식 난이도가 있더라도 질환을 명확히 구분
임상적 지식 통합 시 낮은 신뢰도를 가진 치아 예측을 필터링 가능

Conclusion

기존에 사용한 간접적 측정 지표인 bone loss 대신, 실제 임상 진단 데이터를 GT로 사용해 임상 기준과 차이가 존재하는 문제 해결
Dual Branch Classification을 통해 국소적, 전역적 특징을 학습 및 추출하고 실제 임상 진단 절차를 추가하여 예측 신뢰도 상승
질병이 초기 단계인 경우 질환을 정확히 탐지하는 것이 어려움

My Comments

임상 지식 반영

간단한 임상 지식을 반영해 설계하여 성능을 높인 점이 유의미

local + global

전체적인 판단과 국소적인 영역의 판단을 모델에 제공하여 동시에 사용

세밀한 부분까지 상호작용하며 예측에 활용할 수 있음

Multi-task 전략

CAM 기반 multi-task 구조가 모델의 설명성을 높여 의학적 해석 가능성을 상승시킴

공간 정보 융합

3차원 공간 정보까지 포함하여 다양한 정보를 Fusion 하는 경우 성능이 상승할 가능성이 높아 보임

임상 지식 전이

의사의 경험적 지식을 얼마나, 또 어떤 방식으로 모델에게 전이할 수 있을지가 앞으로 중요한 과제일 것이라 추측됨

BITLAB

AI Insight with Bitlab