1. RSNA 2023 Abdominal CT
복부 CT영상 기반 5가지 장기에 대한 injury 여부와 강도 예측(classification) task
- meta : patient_id series_id, aortic_hu, incomplete_organ
- train : patient_id, (bowel, extravasation ; healthy/injury), (kidney, liver, spleen ; healthy/low/high), any_injury
3. patient id 기준 inner join 수행
merged_data = pd.merge(df_meta, df_train, on='patient_id', how='inner')
merged_data.head()
4. aortic_hu 기준으로 데이터 선별


- patient id 당 series id (CT 이미지 슬라이드 번호) 개수 & hu 값 min/max 계산
- series 중복데이터일 경우 aortic_hu 큰 거만 남김 + patient_id별로 aortic_hu의 최대값을 구함
(❓ 왜 hu 최대값 선택하는건지 궁금함. 특성을 더 잘 나타내나?)

- 복부 내 장기 관련 CT니 당연하지만, hu 도수분포표 확인 결과 soft tissue 범위
5. 이상치 제거
- aortic_hu outliers 제외 (IQR = Q3-Q1)
- incomplete organ 제외