TxAgent & Tool Universe

.·2025년 9월 10일

Paper & Theory

목록 보기

8/9

TxAgent: 정밀 치료 AI 에이전트의 시대

의료 분야의 AI는 주로 컴퓨터 비전(CV) 분야에서 활발하게 연구되어 왔습니다. 종양 검출과 같은 질환 진단이나 세포 이미지 분석이 대표적인 예시입니다. 하지만, TxAgent는 LLM 기반의 AI 에이전트로서, 특히 환자 개개인의 특성과 상황을 고려하는 정밀 치료(precision therapeutics) 분야에서 그 실용성을 증명하고 있습니다.

정밀 치료는 환자의 나이, 유전적 요인, 복용 약물 등 수많은 변수를 종합적으로 고려해 최적의 치료법을 제안하는 만큼 복잡한 추론 과정이 필요합니다. TxAgent는 이처럼 복잡한 분야에서 특히 뛰어난 성과를 보였습니다.

TxAgent의 구조

TxAgent는 크게 세 가지 핵심 요소로 구성됩니다.

다단계 추론 LLM: 복잡한 문제를 여러 단계로 나누어 해결합니다.
ToolUniverse: 치료법 추론에 필요한 211개의 도구 모음집입니다.
ToolRAG: 현재 상황에 적합한 도구를 찾아주는 검색 모델입니다.

1. 다단계 추론 LLM

TxAgent는 Llama-3.1-8B-Instruct 모델을 파인튜닝하여 사용되었습니다. 해당 논문에서는 TxAgent를 GPT-4o 및 더 큰 규모의 Llama-3.1-70B-Instruct 모델과 비교하여 그 우수성을 입증합니다.

이 모델은 사고 과정 - 함수 호출 - 반복적 추론의 과정을 거쳐 현재의 상황에서 올바른 도구를 호출하고 적절한 치료법을 생성해냅니다.

사고 과정 (Thought): 각 단계별 사고 과정을 자연어로 생성하며 다단계 추론을 진행합니다.
함수 호출 (Function calls): 사고 과정에 따라 적절한 도구를 호출하여 전문 지식을 불러옵니다.
반복적 추론 (Iterative reasoning): 단일 도구의 지식으로 해결할 수 없는 문제에 대해, 피드백을 바탕으로 반복적인 분석을 진행합니다.

결론적으로, 다단계 추론 LLM은 외부 도구와 ToolRAG를 활용해 최적의 답변을 도출하는 사고 과정을 학습하도록 파인튜닝된 모델입니다.

2. Tool Universe

ToolUniverse는 치료법 추론에 필요한 211개의 도구를 모아 놓은 종합 바이오메디컬 도구 상자입니다. 이 도구들은 각각의 분야에 대한 전문 지식을 담고 있으며, 신뢰할 수 있는 외부 지식 소스와 연결되어 있습니다.

ToolUniverse의 도구들은 미국 식품의약국 승인 의약품 정보, Open Targets, Human Phenotype Ontology와 같은 공신력 있는 오픈 데이터베이스에 직접 접근하여 약물이나 치료법에 대한 최신 상세 정보를 파악합니다. 211개의 도구 모두 실시간으로 업데이트되는 데이터베이스에 접속하므로, 새로운 지식(예: 2025년 FDA 승인 신약)도 모델 재학습 없이 즉시 적용할 수 있습니다

각 Tool의 사용 예시는 다음과 같습니다.

키순라(Kisunla)의 권장 용량은 무엇인가요?
"키순라의 권장 용량은 처음 3회 투여 시 약 30분 동안 정맥 주입으로 700mg을 4주마다 투여하는 것입니다. 이후 3회 투여 후에는 4주마다 1400mg으로 증량합니다."
-> get_dosage 함수호출 결과

Prozac과 Xolremdi를 함께 복용해도 안전한가요?
Prozac은 CYP2D6 경로에 의해 대사되고, 강력한 CYP2D6 효소 억제제이기도 합니다."
-> get_drug_interactions 함수호출 결과

3. ToolRAG

ToolRAG는 현재 상황에서 가장 적합한 Tool(Tool Universe)를 찾아주는 검색 모델입니다. RAG라는 용어가 붙어서 오해할 수 있지만 직접 외부 지식을 가져오는 것이아닌 적합한 Tool을 연결시켜주는 역할입니다.

4. TxAgent의 동작 흐름

TxAgent는 사용자의 자연어 질문에 답하기 위해 다음과 같은 다단계 추론(multi-step reasoning) 과정을 거칩니다. 이 과정은 단순히 정보를 검색하는 것을 넘어, 여러 도구를 활용해 복합적인 판단을 내립니다.

사용자의 질문 수용: "5세 남자아이가 감기 걸렸을 때 먹으면 좋은 약물은?"과 같은 자연어 질문을 받습니다.
질문 분석 및 사고 계획 수립: TxAgent의 언어 모델은 질문을 분석하여 '5세 남자아이', '감기'와 같은 핵심 정보를 파악합니다. 이를 바탕으로 소아 환자에게 적합한 감기약 정보를 찾아야겠다는 계획을 수립합니다.
ToolRAG 호출: TxAgent는 ToolRAG 모델을 호출하여 계획 실행에 적합한 도구들을 검색합니다. 이 도구들은 ToolUniverse 내 211개의 도구 중에서 선택됩니다.
도구 선택 및 함수 호출: ToolRAG가 반환한 후보 목록에서 TxAgent는 가장 적합한 도구를 선택합니다. 이후, 이 도구에 필요한 매개변수를 포함하여 함수 호출을 생성합니다.
도구 실행 및 전문 지식 수집: 생성된 함수 호출이 실행되면, 해당 도구는 FDA 데이터베이스와 같은 외부 지식 소스에 접근해 검색 결과를 반환합니다. TxAgent는 이 결과를 바탕으로 약물 후보들이 대상자에게 적합한지 평가하고, 추가적인 정보가 필요하면 다른 도구를 호출하며 추론을 이어갑니다.
답변 생성: 모든 추론 단계를 통해 충분한 정보가 확보되면, TxAgent는 최종 답변을 생성합니다. 이 답변에는 추천 약물과 함께 왜 그 약물이 선택되었는지에 대한 근거를 상세히 제시하여 투명성과 신뢰성을 높입니다.

TxAgent의 의의와 미래 전망

TxAgent는 단순히 정보를 검색하여 답변하는 것을 넘어, 복잡한 의료 문제에 대해 투명하고 논리적인 추론 과정을 제공한다는 점에서 큰 의의를 가집니다. 기존 LLM이 가진 지식 부족, 환각 현상, 그리고 추론의 불투명성 문제를 해결하며,

의사결정 과정을 검증할 수 있는 새로운 AI 에이전트 프레임워크를 제시했습니다. 특히, 논문에서 진행된 벤치마크 테스트에서 TxAgent는 GPT-4o나 더 큰 규모의 모델들을 능가하는 성능을 보였고, 이는 모델의 크기보다 특화된 추론 능력과 도구 활용이 중요하다는 것을 보여줍니다.

하지만 TxAgent 역시 개선될 여지가 있습니다. 현재는 ToolUniverse에 포함된 도구에만 의존하므로, 특정 데이터 유형에 대한 질문에는 답변이 제한될 수 있습니다. 또한, 병리 이미지, 전자 건강 기록과 같은 다양한 형태의 의료 데이터를 처리하는 기능은 아직 지원하지 않습니다.

이러한 한계는 앞으로의 연구 과제입니다. 멀티모달 기능의 확장을 통해 TxAgent는 더욱 복잡한 임상 분석을 수행할 수 있게 될 것이며, 궁극적으로 의료 전문가들의 의사결정을 돕는 강력한 지원 도구가 될 것으로 기대됩니다

유연한 사고와 적극적 태도

이전 포스트

CLIP: Learning Zero-Shot Prediction without Labeled Data

다음 포스트