동생이 한의사다보니, 내가 운동하다가 아프면 침을 놓아 주기도 하고, 한의학과 관련된 얘기를 종종 한다. AI가 한의학에 접목되었을 때의 시너지에 대해 관심이 생겼다. 그래서 검색하다보니 책이 있더라!

AI 개인 프로젝트의 아이디어를 얻을 수 있지 않을까 해서 읽고 흥미로운 내용을 정리해본다.
📚 AI와 한의학
-
한의학은 오랜 시간 축적된 경험과 이론, 그리고 직관적 의사 결정에 기반해 발전해 왔다. 아날로그 형태로 제공되는 데이터를 내적으로 통합하고 결과를 산출하는 한의학의 진료 방식은 디지털 데이터와 통계적 패턴 인식에 강점을 지닌 인공지능과 결합하기 어려워 보이기도 한다. 하지만 최근 자연어 처리, 거대 언어 모델, 이미지 프로세싱 등의 기술이 급격히 발전해 온 만큼 아날로그 데이터에 대한 접근 방식이 이전에 비해 훨씬 정교해지고 있다.
-
머신러닝이 단순 통계 기법보다 더 뛰어난 잠재력을 발휘하는 경우가 분명히 있다. 다차원적이거나 복합적인 패턴을 다루거나 이미지나 자연어 등 비정형 데이터를 해석해야 할 때, 혹은 기존 이론적 가설만으로는 포착되지 않는 새로운 상관관계를 찾고자 할 때 머신러닝은 뛰어난 도구가 된다. 실제로 많은 AI연구가 방대한 의료 데이터에서 예후나 진단적 패턴을 찾아내는 데 집중하고 있다.
-
의료 분야에서는 지도학습이 가장 많이 활용된다. 환자의 데이터를 바탕으로 질병 유무를 판정하거나, 병세의 진행 상황을 예측하는 대부분의 모델은 무엇이 정답(레이블)인지 알고 시작하기 때문이다. ex) 한의학에서는 맥상, 설진, 환자의 병력 등에 대한 자료와 진단 결과를 레이블로 달아 두고 충분히 학습시킨다면, 새로 방문한 환자의 정보를 토대로 유사한 패턴을 가진 환자군의 치료 사례를 참고해 진단이나 예후를 추론할 수 있을 것이다.
-
수십만, 수백만 건의 환자 기록에서 인간이 미처 발견하지 못한 연관성을 찾아내거나, 약물 반응을 새로운 방식으로 분류하는 연구가 대표적 사례.
-
한의학에서, 일부 분야는 양의학적 연구 방법론을 그대로 차용해도 무방할 수 있지만, 어떤 분야는 한의학이 가진 독특한 진단 체계를 충분히 반영해야 할 필요가 있다. 선행 연구 사례를 살펴봄으로써 이러한 ‘특수성’을 어떻게 해석할지에 대한 아이디어를 얻을 수 있다.
한의학적 진단과 AI
- 한의학적 진단은 망문문절을 통한 주관적 데이터의 수집과, 이를 미리 학습된 변증과 통합하는 과정으로 이루어진다. 주관적 데이터를 의사 개인이 처리하는 과정은 일괄적인 기준으로 평가하기 어려웠으며, 이를 객관화하고 정량화하기 위한 여러 시도들이 이루어져 왔다. 이에 지금까지 이루어져 온 진단 표준화와, 머신러닝에 기반한 진단 표준화 연구에 대해 정리해본다.
- “변증”? : 한의학의 고유한 진단법으로, 사진에 따라 환자의 임상 증상을 수집하고 이를 결합해 종합, 분석함으로써 질병에 대한 전체적인 이해를 토대로 증상에 대한 정확한 진단을 내리는 것이다.
- 진단은 대개 문제가 제시되고 이에 대한 답을 탐색하는 과정으로 이루어지므로 입력(x)에 대해 답안(레이블, y)을 지정한 데이터를 학습시키는 지도학습이 적절한 방법론으로 여겨진다. 지도학습 알고리즘은 레이블링된 데이터를 기반으로 환자의 증상, 검사 결과, 의학적 상태 간의 관계를 학습할 수 있으며, 질병 분류, 리스크 예측, 환자 결과 예측 등의 작업에 일반적으로 사용된다.
- 로지스틱 회귀, 선형회귀, 의사결정트리, 랜덤포레스트, 서포트벡터머신, 신경망 등의 테크닉이 사용될 수 있음.
- 과거 의료기록과 현재 상태를 분석해 특정 질병의 발생 가능성을 예측하거나, 심혈관 질환 등의 고위험 상태에 대한 예측을 시행하는 모델 또한 연구되고 있다.
- 머신러닝은 변증 과정을 정량적이고 경험적인 방식으로 접근하는 것을 가능하게 하면서, 복잡한 변증 과정을 표준화하고 재현 가능하게 만들어 치료의 일관성과 신뢰도를 제고할 가능성을 제시하고 있다.
- ex) 어혈 변증 모델 구축 연구 - 어혈 변증의 진단을 자동화하는 알고리즘 개발
- 중의학계에서는 다낭성 난소 증후군 환자를 5가지 변증으로 분류하고 임상적 특징에서 주요 변수를 도출, 머신러닝 알고리즘을 통해 변증을 예측하는 모델을 구축했다. (근데 변증이 뭐지) 참가자 수가 적지만, 주관적 판단에 의존하던 변증 과정을 머신러닝을 통해 예측하도록 구성한 연구다.
- 공통적 고민 : 문제와 정답이 잘 구성되어 있는 데이터 세트를 어떻게 대규모로 확보하는가?
사상체질의학과 AI
- 사상체질의학 : 태양/태음/소양/소음인의 4가지로 분류하여 각 체질에 따른 처방으로 치료함
- 사상의학에서는 진단과 치료 경로를 설정하기 위해 어느 체질에 배속되는지를 매우 중요하게 여겼고 다양한 판정수단이 있음. 그러나 이런 진단 수단은 각 개인의 복합적인 요인으로 인해 구분이 어렵고 주관적 판단 요소가 개입하게 됨.
- 정량적 요소를 활용해 진단하려는 시도 - 체간계측, 안면계측, 유전체를 통한 분류, 설문지 개발 등
- 임상 한의사를 대상으로 한 설문 중 ‘초진 환자의 사상체질 진단 방법 - 89.2%가 망문문절을 선택, 설문지법에 30.5%, 체간계측법 13.3%, 안면계측법 5.8%, 음성분석법 3%
- 체간계측, 안면계측, 설문지법 등에서 수집된 값은 환자의 특성으로서 머신러닝 기법의 사용에 활용 가능함.
- 안면 데이터 활용 연구 - 3738명을 대상으로 태음인/비태음인, 소음인/비소음인, 소양인/비소양인의 이진 분류를 시행, 합성곱 신경망 알고리즘으로 안면 영상을 분류함
- 레이블에 해당하는 진단 결과에 대한 타당화가 적절하게 이루어졌을 때, 사상체질 분류에 대한 모델의 신뢰도와 활용도가 확보될 수 있을 것이다.
맥진, 설진 그리고 AI
- 맥진 : 한의학의 사진 중 절진에 해당. 맥의 깊이와 세기, 리듬, 폭 등을 손끝 감각으로 파악해 진단함. 맥진은 주로 개인의 숙련도와 감각에 의존하기 때문에 임상가들 사이에서도 의견이 가장 분분한 도구 중 하나로 꼽힘. 맥이 가진 특성을 정량화하고 객관화하기 까다롭다.
- 다양한 맥진기가 개발되었음에도 임상 현장에서는 잘 사용되지 않음. 신뢰성과 재현성 부족, 공학적 측면에서 맥압과 동시에 맥위를 측정하기 어렵고, 맥폭과 맥장을 동시에 측정하기 어렵다.
- 맥진을 과학화, 정량화하려면 맥이라는 현상을 일정한 기준을 가진 물리량으로 전환하는 과정을 필요로 함.
- 설진 : 사진 중 망진의 하나로 혀를 이용해 신체의 이상 여부를 진단.
- 200명의 혀 이미지를 수집하고, 변증 설문지의 답변을 받아 회귀 모델 만드는 연구가 있었음
- 일반적으로 의사가 맥진과 설진에 숙련되는 법 : 텍스트에서 명시적 지식 학습, 직접 환자 또는 정상인을 대상으로 진단 시행, 지도자로부터 맥상 및 설상에 대한 피드백을 포함한 암묵적 지식을 전달받음으로써 개인 학습을 강화함. → 지도학습과 유사한 면이 있다
- 맥진과 설진의 정확도를 높이고 패턴을 찾아내고, 새로운 모델을 만드는 연구들이 있으나 이 연구들을 성공적으로 수행하려면 대규모 데이터를 안정적으로 확보가능해야 함..
처방의사결정과 인공지능
- 임상의사결정지원시스템(CDSS, Clinical Decision Support System) : 환자로부터 얻어진 임상정보를 바탕으로 의료인이 질병을 진단하고 치료할 때 의사결정을 도와주는 정보시스템
- 중국의 전통 중의학(TCM) 분야에서의 CDSS개발 : 의서, 임상례, 명의의 경험을 수집하고 데이터 마이닝 기술로 표준화해 지식 모델을 구축하고 증후 및 질병의 관계를 분석하고, 중의학 원리에 기반한 의사결정 규칙을 생성해 데이터베이스를 구축하고, 자연어처리를 통한 방대한 중의학 문헌과 임상데이터를 처리해 패턴과 규칙 추출과 딥러닝, 머신러닝을 통한 환자 데이터를 학습해 진단 및 치료 모델 지속적 개선이 이루어질 수 있다고 보고함
- 한의학계에서의 예시
- 한의박사 시스템 : 환자가 호소하는 주요 증상을 입력하면 과별 복합 증상의 연관성을 분석하고 가장 적합한 방제를 추천함. 증상 선택 후 단계적으로 제시되는 질문에 답변하면 최종적으로 가능성이 높은 질환과 이에 대한 설명, 치료법, 한방요법 등의 정보를 제공.
- OMS-Prime : 한의학 진단 및 처방 전문가 시스템. 환자의 증상을 입력하면 표준화된 진단 및 처방결과를 도출함
- 헬리큐어의 예진(Ye-jin) : 환자정보를 입력 → 환자에게 카카오톡으로 증상 설문 링크 전송 → 독자적 진단 알고리즘을 통해 변증을 선택, 처방 단계에서 알고리즘이 추천한 처방과 약재를 참고할 수 있는 형태.
- 인삼AI : LLM + RAG. 자연어로 입력된 환자 상황을 한의학적 관점에서 증상 정리, 변증 진단을 추천, DB를 기반으로 여러가지 처방을 알려줌.
- 한의약융합연구정보센터의 약물 상호 작용 데이터베이스 : 한약과 양약, 식이보충제, 음식 등의 약물 상호작용을 제시함. 전자 차트 등에 이 DB를 통합하면 환자의 복용 약물과 의사가 처방하려는 약물을 대조하고 DB에서 정보를 리콜해 상호작용 가능성이 있을 경우 정보 알람을 제시하는 시스템이 있으면 좋을듯. 이 과정에서 환자의 응답, 의사가 작성한 의무 기록을 자연어 처리를 통해 활용하면 효율적 관리를 위해 사용될 수 있는 기술일 것.
- 향후 과제
- 대규모의 정제된 임상 데이터 구축이 필수적일 것. 한의계의 현실 : 이러한 데이터가 부족함…
의서와 NLP, 텍스트 마이닝
- 한의학에서 지식 전달의 수단으로 사용된 것은 주로 의서.
- 한의학적 언어로 표현된 비정형 데이터가 머신러닝의 분석 되상이 될 수 있는가?
- 고전 의학서인 상한론에서 언급된 증상과 한약재 간 관계를 정량적으로 분석하여 이해하고자 함. 텍스트 데이터를 구조화해 각 장에서의 용어와 문서 내 빈도를 바탕으로 TF-IDF 점수를 산출해 단어 중요도 평가함. 등등… 고전 의서의 지식을 정량적으로 해석할 가능성 제시.(장동엽 외, 2023)
- 사상체질 진단이 대개 환자의 주관적 증상과 한의사가 관찰한 결과를 통합해 고전문헌과 결합함으로써 이루어진다는 점에 착안, 2000~2022 등재된 사상체질 진단 치험례 논문 454편의 텍스트를 대상으로 텍스트 마이닝을 시행, 체질 진단의 주요 단어를 추출하고 적절한 머신러닝 기버블 결정함. TF-IDF값을 토대로 체질 진단에서 필요한 특징적 요소를 체질별로 파악. 치험례 데이터를 바탕으로 한 알고리즘에 새로운 정보를 입력할 경우, 머신러닝 알고리즘이 84%의 정확도로 체질 진단을 도출 가능함. 포함된 치험례는 적지만 추후 더 많은 증례를 포함시켜서 모델 발전을 기대할 수 있다.(김진석 외, 2024)
- 동의보감에 기반한 변증 진단을 분석하기 위해 자연어처리와 기계학습을 적용. 동의보감에서 증상 및 변증 데이터를 추출해 데이터베이스를 구축하고, 이를 토큰화하여 NLP 도구로 분석. Word2Vec 모델을 활용해 증상 문장을 수치 벡터로 변환하고, 로지스틱 회귀모델을 통해 패턴 예측 모델을 훈련. 동의보감의 증상과 변증 패턴을 바탕으로 한 객관적 진단모델 개발의 가능성을 보여줌. (Lee, 2020)
- 한의학에서 의서는 이전 세대부터 축적된 의학지식의 전달을 매개하는 매체의 역할을 담당함. 텍스트 마이닝과 머신러닝의 결합은 방대하게 축적된 의서의 지식에서 특정 입력에 연관된 임상적 정보를 제공함으로서 효율적인 지식의 관리와 이용에 활용될 수 있다.
경혈, 침술과 인공지능
- 침구요법은 한의학의 기초 이론을 근거로 하여 물리적 자극을 주어 생체에 반응을 일으키게 함으로써 질병을 예방, 완화, 치료하는 한의학 의료 기술의 한 분야로 정의된다.
- 고전 문헌 또한 특정 질환에 어떤 경혈을 주로 사용한다는 기술과, 특정 경혈은 어떤 질환을 주로 치료한다는 기술이 함께 나타나는 형태를 보인다.(채윤병, 2021)
- 임상 현장에서 침 치료의 핵심 : 질병, 증상에 따라 어떤 혈위를 어떻게 조합해 시술할 것인가?(선혈 과정)
- 패턴과 규칙을 발견하기 위해 데이터 마이닝이 주목받는다. 목표하는 결과를 찾아내 임상에서 수집된 여러 형태의 데이터를 체계적으로 해석하고, 진료 현장에서 쓰이는 침 치료의 근거를 보다 명확하게 밝혀낼 수 있을 것.
- 선혈 과정 : 질병과 경혈이 일대일로 대응되는 것이 아니라 변증 과정에 따라 선혈 과정이 다층적으로 진행된다는 특징을 갖는다.(이인선, 2021)
- ANN을 사용해 임상 기록으로부터 추출한 증상 정보와 침 치료에 사용되는 경혈과의 관계를 훈련함. 87개의 증상과 77개의 경혈 간 관계 모델링. 평균 정밀도 0,865(Jung, 2019)
- 기존의 침구의학 연구는 효과의 규명, 왜 효과가 있는지에 대한 고찰을 위주로 이루어짐(Lee, 2019). 그러나 인공지능과 결합한 최신 연구들은 침구 요법의 실체를 더 정밀하게 규명하고 환자 개인의 증상과 체질에 맞춰 최적의 자극 지점을 설계 적용하는 데까지 발전할 가능성을 제시.
네트워크 약리학
- 여러 구성 성분과 여러 단백질 간의 상호작용을 탐구.
- 네트워크 약리학을 사용한 한약 연구에서 가장 자주 사용되는 DB : 중의통합데이터베이스, 중의약리학데이터베이스 및 분석플랫폼. 기존 중의학 DB와 문헌에 대한 텍스트 마이닝으로 구축됨. 중의약물 정보와 성분정보, 처방정보를 제공. 약물의 소화 흡수율, 대사율, 반감기 및 물리적 특성 정보를 포함한다.
- 국내의 경우 한약 실험 정보 데이터가 산재되어 있다는 한계. 한의약진흥원에서 플랫폼 구축 사업을 추진.