RAPTOR 논문 분석

김소은·2025년 8월 20일

RAPTOR: Recursive Abstractive Processing for Tree‑Organized Retrieval (arXiv:2401.18059, 제출일: 2024년 1월 31일)


핵심 아이디어

  • 기존 RAG(Retrieval-Augmented Generation) 방식은 문서에서 짧고 연속된 조각만을 검색하므로 문맥의 전체적인 이해가 어려움 (arXiv, LangChain).
  • RAPTOR 는 문서를 작은 텍스트 청크로 나눈 뒤, 이를 재귀적으로 임베딩, 클러스터링, 요약하여 하향적 요약 트리(tree of summaries) 구조를 만듭니다 (arXiv).
  • 추론 시에는 이 트리 구조에서 필요한 요약 수준(level of abstraction) 에서 정보를 검색함으로써, 문서 전체를 아우르는 맥락 활용이 가능해집니다 (arXiv).

성능 및 효과

  • 제어된 실험 결과, RAPTOR를 사용한 검색 방식이 전통적인 RAG 모델 대비 여러 작업에서 현저한 성능 향상을 보여줌 (arXiv).
  • 특히 다중 단계 추론(multi-step reasoning) 이 필요한 질문 응답(QA) 과제에서 GPT‑4와 결합 시, QuALITY 벤치마크의 절대 정확도(accuracy)를 20%p 향상시켰습니다 (arXiv).

기술적 구성 및 파이프라인

  1. 문서를 여러 개의 청크(text chunks) 로 분할.
  2. 각 청크를 임베딩 → 유사한 청크들은 클러스터링 → 클러스터 단위로 요약 생성.
  3. 요약된 결과를 다시 묶고 요약하는 재귀적 요약(recursive summarization) 과정을 반복.
  4. 이 과정을 통해 다계층 구조의 요약 트리 완성.
  5. 추론 시 적절한 계층에서 검색 가능—짧은 답변을 원하면 낮은 레벨, 깊이 있는 이해가 필요하면 높은 레벨 활용.

장점 & 한계

항목내용
장점• 전체 문서 맥락 반영 가능
• 다양한 추론 수준 선택적 검색
• 다중 단계 추론 QA에서 우수한 성능
한계• 트리 구조 생성 및 유지에 따른 계산/메모리 오버헤드 존재
• 문서 추가/삭제가 빈번한 동적 데이터 환경에는 재구성 비용이 높음 (arXiv)

동적 파일셋 환경을 위한 후속 연구로 adRAP (adaptive RAPTOR)가 도입되었으며, 문서 추가/삭제 시 전체 트리를 재컴퓨팅하지 않고 증분 업데이트 방식으로 처리하는 방법을 제안했습니다 (arXiv).

또한, postQFRAP라는 후처리(query‑focused recursive abstractive processing) 방식도 제시됐습니다. 이 방식은 기존 RAG 파이프라인에 블랙박스처럼 덧붙일 수 있는 레이어로서, 검색된 정보에 대해 쿼리 중심의 요약을 재귀적으로 수행함으로써 질을 높이는 접근 방식입니다 (arXiv).


전체 요약

  • RAPTOR는 문서 이해를 위한 RAG 접근의 한계를 극복하기 위해 계층적 요약 트리 구조를 활용합니다.
  • 이를 통해 긴 문서에 대한 효율적, 추상적인 검색이 가능하며, 다중 단계 추론 QA에서 특히 뛰어난 성능을 보입니다.
  • 다만 구현 비용과 동적 문서 환경에서의 유연성은 향후 연구 과제로 남아 있으며, adRAPpostQFRAP 같은 후속 연구들이 이를 개선하고자 합니다.

profile
개발자

0개의 댓글