[논문 리뷰] Adaptive-RAG: Learning to Adapt Retrieval-Augmented Large Language Models through Question Complexity

sihyeong·2025년 4월 4일

RAG

목록 보기

9/11

2024 NAACL-long

질의의 복잡도를 평가할 수 있는 분류기를 통해 반복적 검색 증강, 단일 단계 검색 증강, 검색을 사용하지 않은 방법 적용

단일 모델에 의존한 적응형 검색 방식은 다양한 복잡도를 가진 질의를 효과적으로 처리하는 데 최적이 아닐 수 있음

→ 모든 질의에 대해 지나치게 단순하거나 복잡한 방식을 적용하는 경향이 있기 때문

LLM과 Retriever의 작동 방식은 입력과 관계 없이 일정하게 유지됨
즉, 내부 모델 아키텍처나 파라미터를 변경하지 않고도 다양한 복잡도의 질의 사이를 원활하게 오갈수 있음

→ 이후, Cross-Entropy Loss를 바탕으로 질의의 복잡도 학습

SQuAD v1.1, NQ, TriviaQA

MuSiQue, HotpotQA, 2WikiMultiHopQA

Simple
- No-Retrieval
- Single-step Approach
Adaptive
- Adaptive Retrieval(Mallen et al., 2023)
- Self-RAG
- Adaptive-RAG (ours)
Complex
- 반복적으로 Retriever와 LLM을 호출 및 CoT 방법론을 적용한 방법(Trivedi et al., 2023)

서로 다른 범주의 모델들은 직접적으로 비교할 수 없지만, Adaptive 접근법이 Simple 범주의 모델들보다 더 효과적이면서 Complex 모델들보다는 더 효율적이어야 함. 그래서, Adaptive-RAG Oracle 버전도 있음

그러니까, 실제 환경에서는 사용할 수는 없지만, 질의의 복잡도를 100% 정확하게 예측하는 분류기가 있을 경우, Adaptive-RAG의 최대 성능이 어느 정도인지 평가하기 위함

검색 모델
- BM25
생성 모델
- gpt-3.5-turbo-instruct
- FLAN-T5-XL, XXL
분류 모델
- T5-Large
외부 지식 소스
- single-hop
  - DPR에서 전처리한 위키피디아 덤프
- multi-hop
  - IRCoT에서 전처리한 위키피디아 덤프

Table 2

stick-to-it-iveness