쿼리 난이도에 따라 다른 RAG 전략을 선택하는 Adaptive-RAG 논문 정리

jihyelee·2024년 12월 2일
0

Adaptive-RAG: Learning to Adapt Retrieval-Augmented Large Language Models through Question Complexity (link, NAACL 2024)

배경지식

  • Open-domain QA
    • 쿼리와 관련된 문서를 기반으로 하여 쿼리에 정확하게 응답하는 태스크
  • Multi-hop QA
    • 전통적인 Open-domain QA를 확장한 태스크
    • 더 복잡한 쿼리에 답하기 위해 여러 개의 문서를 기반으로 답변하는 태스크
    • 여러 개의 문서에서 정보를 가져오기 위해, 종종 반복적으로(iteratively) 수행
  • Adaptive Retrieval
    • 쿼리의 복잡도를 기반으로 문서를 검색할지 여부를 결정하는 전략
    • 쿼리의 복잡도는 개체(entity)의 빈도를 활용해 평가하거나, BERT 기반의 LM을 활용해 검색, 읽기, 리랭킹의 과정을 여러 번 반복하는 연구들이 존재했음

문제점

  • 기존의 RAG 방법론들은 쿼리들의 각기 다른 복잡도를 고려하지 않음
    • 복잡한 다단계(multi-step)를 요구하는 쿼리를 해결하지 못하거나
    • 단순한 쿼리에 불필요한 연산 오버헤드를 추가하거나
  • 하나의 접근방식이 모든 경우에 적용될 수 없음

해결책

Adaptive RAG

  • 쿼리의 복잡도를 기반으로 적절한 RAG 전략을 역동적으로 선택하는 방법론
    • 검색을 하지 않거나, 한 번 검색하거나, 여러 번 검색하는 세 가지 단계로 분류
  • 쿼리의 복잡도를 평가하기 위해, 작은 모델을 분류기(classifier)로 훈련

Classifier 훈련 데이터셋 생성

  • 사람의 개입 없이 자동으로 레이블링된 학습 데이터셋을 활용
  • 클래스 (레이블) 총 3개로 구성
    • 언어모델 자체로 답변 가능 (검색 필요 없음)
    • 한 번의 검색으로 응답 가능 (single-step)
    • 여러 번의 검색이 필요한 복잡한 쿼리(multi-step)
  • 데이터셋 생성 방법
    • 모델이 예측한 응답
      • 세 개의 검색 전략을 기반으로, 모델이 적절히 응답할 수 있는지 여부에 따라 레이블링
      • 만약 single-step, multi-step에서 모두 답변 가능한 경우, 더 단순한 방법론인 single-step으로 정답을 레이블링
    • 기존 데이터셋의 타겟 시나리오 (single-step인지 multi-step인지)
      • 모델이 세 개의 전략에서 모두 적절한 응답을 하지 못할 경우
      • 기존 데이터셋이 single-step을 위한 건지, multi-step을 위한 건지에 따라 결정

평가

  • 모델
    • 검색 시 BM25 활용
    • 응답 생성 시 FLAN-T5와 GPT-3.5 활용
    • 쿼리 복잡도 분류의 경우 T5-large 활용
  • 데이터셋
    • Single-hop
      • SQuAD v1.1
      • Natural Questions
      • Trivia QA
    • Multi-hop
      • MuSiQue
      • HotpotQA
      • 2WikiMultiHopQA
  • 평가지표
    • 효과성 (effectiveness)
      • F1 (정답과 모델 답변 사이 겹치는 단어의 수)
      • EM (정답과 모델 답변이 동일한지)
      • Acc (모델 답변에 정답이 포함되어 있는지)
    • 효율성 (efficiency)
      • 검색 및 생성(retrieval-and-generate) 단계의 수
      • 각 쿼리에 응답하는 평균 시간

profile
Graduate student at Seoul National University, majoring in Artificial Intelligence (NLP). Currently AI Researcher at LG CNS AI Lab

0개의 댓글