[DB : Data] 의료 데이터 카테고리별 이해 : 영상/사진/처방,EMR 데이터.

0

[DB : Data] 의료 데이터 카테고리별 이해 : 영상/사진/처방,EMR 데이터.

▽ [DB : Data] 의료 데이터 카테고리별 이해 : 영상/사진/처방,EMR 데이터.

목   차

1. 의료 영상 데이터 (Medical Imaging Data)

2. 의료 사진 데이터 (Clinical/Pathology Photos)

3. 의료 처방/진료 데이터 (Clinical / Prescription Data)

🏥 의료 데이터, 처음부터 이해하기

의료에서 다루는 데이터는 크게 3가지로 나눌 수 있음.

    1. 의료 영상 데이터 – 몸속을 찍은 "사진/동영상" 같은 데이터
    1. 의료 사진 데이터 – 몸 겉이나 조직을 찍은 "일반 사진" 같은 데이터
    1. 의료 처방 데이터(EMR) – 환자의 진료 기록이나 약 처방 같은 "표 형식 데이터"

1. 의료 영상 데이터 (Medical Imaging Data)


의료 영상 및 이미지는 "몸 속 구조나 기능을 비침습적으로 관찰"하기 위해 다양한 물리적 원리를 이용해 획득한 결과물입니다.

👉 쉽게 말하면 “몸속을 보는 카메라”.
우리 눈으로는 몸속을 볼 수 없으니까, 특수한 기계를 이용해 안쪽을 찍어낸 것.

👉 “영상 기반 진단”에 활용되는 핵심 데이터.

(1) 기본 개념

  • 단순히 '사진'이 아니라, 인체 내부 구조 * 조직 기능을 기록한 '의학적 영상'
  • 진단, 수술 계획, 치료 모니터링, AI 진단 모델 학습에 필수.

(2) 주요 의료 영상 데이터의 유형 및 특성.

영상 유형물리적 원리차원특징주요 활용
X-ray방사선 투과율2D단일 채널(Grayscale), 저해상도, 빠르고 저렴골절, 흉부질환
CT (Computed Tomography)연속 X-ray 단층 촬영 → 3D 재구성3D (Voxel, HU 단위)HU(Hounsfield Unit)로 조직 밀도 수치화, 수백~수천 장 슬라이스종양, 혈관
MRI (Magnetic Resonance Imaging)자기장 + RF 신호 → 수소 원자 공명3D, 다채널(T1, T2, FLAIR 등)연부조직 구분 탁월, contrast 다양뇌/척추/관절
PET (Positron Emission Tomography)방사성 동위원소 추적자 → 대사 활성도 측정3D기능적 정보 제공, 노이즈 큼암 전이, 신경 질환
Ultrasound초음파 반사2D/3D실시간, 안전, 노이즈 많음산부인과, 심장, 간
fMRIMRI + 시간축4D (x,y,z + time)뇌 활성(혈류 변화) 관찰뇌 과학 연구

X-ray (엑스레이): 뼈 부러졌는지 확인할 때 찍는 사진.

  • 흰색은 뼈, 까만색은 공기(폐 같은 곳).

  • 2D 투영 영상 ( 뼈, 폐 질환, 골절, 치아 등.)

  • 데이터 특징 : 해상도 낮음, 흑백(Grayscale), DICOM 포맷.

  • AI 활용 : 폐렴/결핵 검출, 치과 판독, 골다골증.

CT (Computed Tomography, 전산화 단층 촬영): 여러 장의 X-ray를 찍어서 3D로 만든 것.

  • 마치 빵을 얇게 잘라서 한 조각씩 보는 느낌.

  • 다각도 X-ray를 조합 -> 3D 단층 영상.

  • 데이터 : 수백~수천 개의 "슬라이스(slice)"로 구성된 3D Volume

  • 파일 포맷 : DICOM

  • AI 활용 : 종양 검출/분할(segmentation), 장기 볼륨 측정.

MRI (Magnetic Resonance Imaging, 자기공명영상): 강한 자석과 전파로 몸속 수분(물)을 촬영.

  • 뇌나 근육, 인대처럼 연한 조직을 잘 볼 수 있음.
  • 강력한 자기장 + 라디오파 -> 조직 특성 반영.
  • 소프트 조직(뇌,근육,혈관, 종양) 관찰에 탁월.
  • 데이터 : 멀티 모달리티 (T1,T2, fMRI 등 다양한 contrast).
  • AI 활용 : 뇌질환 탐지, 알츠하이머 진단, 다중 모달 분석.

초음파(US, Ultrasound)

  • 음파 반사 기반 실시간 영상..

  • 실시간으로 볼 수 있고, 인체에 해가 없어요.

  • 데이터 : 동영상(프레임 시퀸스), 잡음(노이즈)많음.

  • 활용 : 산부인과, 심장(심초음파), 간질환

  • AI 활용 : 자동 태아 측정, 병변 검출.

PET / SPECT (핵의학 영상): 방사성 물질을 몸에 넣고 대사 활동(활발한 세포 활동)을 보는 것.

  • 암 같은 질병은 대사 활동이 활발하기 때문에 PET에서 잘 보이게 됨.
  • 방사성 동위원소 주입 후 대사/혈류 측정.
  • 데이터: 기능적 영상 (대사활동) + 해상도 낮음.
  • AI 활용: 암 전이 탐지, 뇌 대사 패턴 분석.

(3) 이 데이터들은 어떻게 생겼을까??

  • 픽셀(Pixel) : 사진에서 한 칸(네모), 우리가 보는 모든 사진은 픽셀들의 모임.

  • 복셀(Voxel) : 3D 영상에서는 '픽셀'이 아니라, '부피 단위' 인 "Voxel"을 씁니다.

    • CT/MRI 같은 데이터는 사실상 '3차원 블록 쌓기' 같은 것.

(4) 데이터 포맷.

  • DICOM (Digital Imaging and Communications in Medicine)

    • 영상 + 환자 정보 + 촬영 장비 정보 포함.
    • 의료 영상 표준 포맷 -> 모든 의료기관/AI연구에서 사용.
    • "개인정보 보호"가 중요.
  • NIfTI (Neuroimaging Informatics Technology Initiative)

    • 뇌 영상 분석(MRI/fMRI)에서 자주 사용.
    • 연구자 친화적 포맷 (Python, MATLAB 등 라이브러리 지원).

2. 의료 사진 데이터 (Medical Photos)


👉 “현미경/사진 기반” 데이터

(1) 기본 개념

  • 영상이 아닌 '사진 수준' 데이터.
  • 피부, 병리 조직, 세포 샘플 등을 촬영한 이미지.

(2) 주요 유형.

1. Dermatology (피부 사진)

  • DSLR/스마트폰/임상 카메라로 촬영.

  • 데이터 특징: 컬러 이미지, 조명·각도에 민감.

  • AI 활용: 피부암(멜라노마) 분류, 습진/여드름 진단.

2. Pathology (병리 이미지, 현미경 슬라이드)

  • 조직 샘플을 염색(H&E stain) 후 슬라이드 제작 → Whole Slide Image (WSI).

  • 데이터 크기: 수 GB~TB (매우 고해상도, 수십만 × 수십만 픽셀).

  • 포맷: SVS, NDPI, TIFF.

  • AI 활용: 종양 세포 검출, 조직 분할(segmentation), 약물 반응 예측.

3. Ophthalmology (안과 사진)

  • 망막(fundus) 사진, OCT(광간섭단층촬영).
  • 데이터: 2D fundus + 3D OCT.
  • AI 활용: 당뇨병성 망막병증, 황반변성, 녹내장 진단.

3. 의료 처방/진료 데이터 (Clinical / Prescription Data)


👉 "비전(이미지)"이 아닌 텍스트·구조화 데이터

(1) 기본 개념.

  • 전자의무기록(EMR/EHR), 진료 노트, 처방전, 검사 결과.

  • 정형 데이터(Structured) + 비정형 데이터(Unstructured) 혼재.

(2) 주요 구성 요소.

1. 정형 데이터.

  • 숫자/코드 기반 → 쉽게 분석 가능.

    • 예: 혈액 검사 수치(CBC, 혈당, 콜레스테롤), 바이탈 사인(혈압, 맥박).
  • 표준 코드:

    • ICD (질병 코드)
    • LOINC (검사 코드)
    • RxNorm (약물 코드)

2. 비정형 데이터.

  • 의사·간호사의 진료 노트 (자연어 텍스트).
    • 예: "환자 호소: 두통, 발열. 처방: 타이레놀 500mg 하루 3회".
  • NLP (자연어처리) 기법 필요.

3. 처방 데이터.

  • 약물명, 용량, 투여 빈도, 기간.

  • AI 활용:

    • 약물 상호작용 탐지
    • 환자 맞춤형 약물 추천 (Precision Medicine)

(3) 데이터 포맷.

  • HL7 / FHIR (Fast Healthcare Interoperability Resources)

    • 의료 정보 교환 표준 (JSON/XML 기반).
    • 실무에서 병원-보험-제약사-연구소 간 데이터 공유에 필수.

0개의 댓글