목 차
1. 의료 영상 데이터 (Medical Imaging Data)
2. 의료 사진 데이터 (Clinical/Pathology Photos)
3. 의료 처방/진료 데이터 (Clinical / Prescription Data)
의료에서 다루는 데이터는 크게 3가지로 나눌 수 있음.
의료 영상 및 이미지는 "몸 속 구조나 기능을 비침습적으로 관찰"하기 위해 다양한 물리적 원리를 이용해 획득한 결과물입니다.
👉 쉽게 말하면 “몸속을 보는 카메라”.
우리 눈으로는 몸속을 볼 수 없으니까, 특수한 기계를 이용해 안쪽을 찍어낸 것.
👉 “영상 기반 진단”에 활용되는 핵심 데이터.
영상 유형 | 물리적 원리 | 차원 | 특징 | 주요 활용 |
---|---|---|---|---|
X-ray | 방사선 투과율 | 2D | 단일 채널(Grayscale), 저해상도, 빠르고 저렴 | 골절, 흉부질환 |
CT (Computed Tomography) | 연속 X-ray 단층 촬영 → 3D 재구성 | 3D (Voxel, HU 단위) | HU(Hounsfield Unit)로 조직 밀도 수치화, 수백~수천 장 슬라이스 | 종양, 혈관 |
MRI (Magnetic Resonance Imaging) | 자기장 + RF 신호 → 수소 원자 공명 | 3D, 다채널(T1, T2, FLAIR 등) | 연부조직 구분 탁월, contrast 다양 | 뇌/척추/관절 |
PET (Positron Emission Tomography) | 방사성 동위원소 추적자 → 대사 활성도 측정 | 3D | 기능적 정보 제공, 노이즈 큼 | 암 전이, 신경 질환 |
Ultrasound | 초음파 반사 | 2D/3D | 실시간, 안전, 노이즈 많음 | 산부인과, 심장, 간 |
fMRI | MRI + 시간축 | 4D (x,y,z + time) | 뇌 활성(혈류 변화) 관찰 | 뇌 과학 연구 |
흰색은 뼈, 까만색은 공기(폐 같은 곳).
2D 투영 영상 ( 뼈, 폐 질환, 골절, 치아 등.)
데이터 특징 : 해상도 낮음, 흑백(Grayscale), DICOM 포맷.
AI 활용 : 폐렴/결핵 검출, 치과 판독, 골다골증.
마치 빵을 얇게 잘라서 한 조각씩 보는 느낌.
다각도 X-ray를 조합 -> 3D 단층 영상.
데이터 : 수백~수천 개의 "슬라이스(slice)"로 구성된 3D Volume
파일 포맷 : DICOM
AI 활용 : 종양 검출/분할(segmentation), 장기 볼륨 측정.
음파 반사 기반 실시간 영상..
실시간으로 볼 수 있고, 인체에 해가 없어요.
데이터 : 동영상(프레임 시퀸스), 잡음(노이즈)많음.
활용 : 산부인과, 심장(심초음파), 간질환
AI 활용 : 자동 태아 측정, 병변 검출.
픽셀(Pixel) : 사진에서 한 칸(네모), 우리가 보는 모든 사진은 픽셀들의 모임.
복셀(Voxel) : 3D 영상에서는 '픽셀'이 아니라, '부피 단위' 인 "Voxel"을 씁니다.
DICOM (Digital Imaging and Communications in Medicine)
NIfTI (Neuroimaging Informatics Technology Initiative)
👉 “현미경/사진 기반” 데이터
DSLR/스마트폰/임상 카메라로 촬영.
데이터 특징: 컬러 이미지, 조명·각도에 민감.
AI 활용: 피부암(멜라노마) 분류, 습진/여드름 진단.
조직 샘플을 염색(H&E stain) 후 슬라이드 제작 → Whole Slide Image (WSI).
데이터 크기: 수 GB~TB (매우 고해상도, 수십만 × 수십만 픽셀).
포맷: SVS, NDPI, TIFF.
AI 활용: 종양 세포 검출, 조직 분할(segmentation), 약물 반응 예측.
👉 "비전(이미지)"이 아닌 텍스트·구조화 데이터
전자의무기록(EMR/EHR), 진료 노트, 처방전, 검사 결과.
정형 데이터(Structured) + 비정형 데이터(Unstructured) 혼재.
숫자/코드 기반 → 쉽게 분석 가능.
표준 코드:
약물명, 용량, 투여 빈도, 기간.
AI 활용:
HL7 / FHIR (Fast Healthcare Interoperability Resources)