[논문리뷰] How to Make your LLMs use External Data More Wisely : Level3 Interpretable Rationale Queries

MS·2025년 8월 31일
0

RAG and Beyond

목록 보기
3/4

5 Interpretable Rationale Queries (L3)

5.1 Overview

  • Interpretable Rationable Queries는 질문에 답변하기 위해 근거가 필요하며, domain-specific한 근거를 이해하고 적용하는 능력이 요구 됨.

  • 이 Level에서의 질문 예시는 아래와 같다.

  • 흉통 진단 지침이 주어질 때, 특정 증상을 가진 흉통 환자를 어떻게 진단하고 치료해야 하는가?

  • 고객 서비스 workflow가 주어질 때, 실제 고객의 질문에 어떻게 답변해야 하는가?

  • 이러한 질의는 해석 가능한 근거가 있는 경우와 근거가 숨겨진 경우로 아래와 같이 분류할 수 있다.

  • 해석 가능한 근거는 문제 해결에 사용되는 사고 과정을 명확하게 설명하는 경우가 많다.

  • plain text: 설명서, 가이드라인, 운영 지침, 메뉴얼 등

  • structured instructions: behavior-tree, finite-state machine 등의 workflow기반의 의사결정 경로

5.2 Challenges and Solutions

  • 프롬프트 최적화 : 도메인 특화 질의에 답변하기 위한 프롬프트 최적화는 그에 맞는 배경 지식과 의사결정 기준이 주어져야 하기 때문에 매우 많은 시간을 소요하는 작업이고, 여러 질의에 대해 맞춤형 프롬프트를 생성하도록 모델을 훈련하는 것도 공수가 필요
  • 제한된 해석 가능성 : 프롬프트가 LLM에 어떤 영향을 끼치는지 알기 어려워 LLM이 정말로 근거를 기반으로 답변하는지 검증하기 어렵다.

5.3 Prompt Tuning

  • Tesx2MDT, MedDM : 프롬프트 튜닝이 아닌, 구조화되지 않은 의료 지식을 LLM이 활용할 수 있는 구조화된 트리 형태의 데이터로 변환하는 방법론 제시
  • TEMPERA, RLprompt : 강화학습 또는 피드백 기반 adapter training으로 최적 프롬프트 생성
  • Reflexion : Actor, Evaluator, Self-Reflection이 상호작용을 통해 이전 답변의 실수를 반성하고, 반성을 통한 성찰을 피드백으로 반영

5.4 CoT Prompting

  • 외부 도구를 활용을 염두에 둔 프롬프트를 설계하여 지식 습득 loof, 일관된 답변 loof, 질문 의도에 부합하는 답변 loof 세 유형의 self-reflextion 루프를 구성
  • CoT 프롬프트를 수동으로 만드는 건 매우 번거로운 일이기 때문에 meta-prompt 등의 다양한 프롬프트 기법 활용
  • LLM기반의 agent workflow 설계는 CoT 프롬프팅을 자연스럽게 활용할 수 있는 방법으로 MetaGPT는 소프트웨어 개발을 위해 각 프로젝트의 이해관계자가 에이전트로서 서로 협력
profile
한 걸음씩 꾸준하게

0개의 댓글