1. data pre-processing

문지우·2024년 5월 15일

[Medical AI] RSNA 2023

목록 보기
2/5

1. RSNA 2023 Abdominal CT

복부 CT영상 기반 5가지 장기에 대한 injury 여부와 강도 예측(classification) task

2. meta data 와 train data 존재

  • meta : patient_id series_id, aortic_hu, incomplete_organ
  • train : patient_id, (bowel, extravasation ; healthy/injury), (kidney, liver, spleen ; healthy/low/high), any_injury

3. patient id 기준 inner join 수행

# patient_id를 기준으로 inner join 수행
merged_data = pd.merge(df_meta, df_train, on='patient_id', how='inner')
merged_data.head()

4. aortic_hu 기준으로 데이터 선별


  • patient id 당 series id (CT 이미지 슬라이드 번호) 개수 & hu 값 min/max 계산
  • series 중복데이터일 경우 aortic_hu 큰 거만 남김 + patient_id별로 aortic_hu의 최대값을 구함
    (❓ 왜 hu 최대값 선택하는건지 궁금함. 특성을 더 잘 나타내나?)
  • 복부 내 장기 관련 CT니 당연하지만, hu 도수분포표 확인 결과 soft tissue 범위

5. 이상치 제거

  • aortic_hu outliers 제외 (IQR = Q3-Q1)
  • incomplete organ 제외
profile
대왕 감자의 성장 일기,,,👩‍🌾

0개의 댓글