RAPTOR 논문 분석

김소은·2025년 8월 20일

RAPTOR

RAPTOR: Recursive Abstractive Processing for Tree‑Organized Retrieval (arXiv:2401.18059, 제출일: 2024년 1월 31일)

핵심 아이디어

기존 RAG(Retrieval-Augmented Generation) 방식은 문서에서 짧고 연속된 조각만을 검색하므로 문맥의 전체적인 이해가 어려움 (arXiv, LangChain).
RAPTOR 는 문서를 작은 텍스트 청크로 나눈 뒤, 이를 재귀적으로 임베딩, 클러스터링, 요약하여 하향적 요약 트리(tree of summaries) 구조를 만듭니다 (arXiv).
추론 시에는 이 트리 구조에서 필요한 요약 수준(level of abstraction) 에서 정보를 검색함으로써, 문서 전체를 아우르는 맥락 활용이 가능해집니다 (arXiv).

성능 및 효과

제어된 실험 결과, RAPTOR를 사용한 검색 방식이 전통적인 RAG 모델 대비 여러 작업에서 현저한 성능 향상을 보여줌 (arXiv).
특히 다중 단계 추론(multi-step reasoning) 이 필요한 질문 응답(QA) 과제에서 GPT‑4와 결합 시, QuALITY 벤치마크의 절대 정확도(accuracy)를 20%p 향상시켰습니다 (arXiv).

기술적 구성 및 파이프라인

문서를 여러 개의 청크(text chunks) 로 분할.
각 청크를 임베딩 → 유사한 청크들은 클러스터링 → 클러스터 단위로 요약 생성.
요약된 결과를 다시 묶고 요약하는 재귀적 요약(recursive summarization) 과정을 반복.
이 과정을 통해 다계층 구조의 요약 트리 완성.
추론 시 적절한 계층에서 검색 가능—짧은 답변을 원하면 낮은 레벨, 깊이 있는 이해가 필요하면 높은 레벨 활용.

장점 & 한계

항목	내용
장점	• 전체 문서 맥락 반영 가능 • 다양한 추론 수준 선택적 검색 • 다중 단계 추론 QA에서 우수한 성능
한계	• 트리 구조 생성 및 유지에 따른 계산/메모리 오버헤드 존재 • 문서 추가/삭제가 빈번한 동적 데이터 환경에는 재구성 비용이 높음 (arXiv)

동적 파일셋 환경을 위한 후속 연구로 adRAP (adaptive RAPTOR)가 도입되었으며, 문서 추가/삭제 시 전체 트리를 재컴퓨팅하지 않고 증분 업데이트 방식으로 처리하는 방법을 제안했습니다 (arXiv).

또한, postQFRAP라는 후처리(query‑focused recursive abstractive processing) 방식도 제시됐습니다. 이 방식은 기존 RAG 파이프라인에 블랙박스처럼 덧붙일 수 있는 레이어로서, 검색된 정보에 대해 쿼리 중심의 요약을 재귀적으로 수행함으로써 질을 높이는 접근 방식입니다 (arXiv).

전체 요약

RAPTOR는 문서 이해를 위한 RAG 접근의 한계를 극복하기 위해 계층적 요약 트리 구조를 활용합니다.
이를 통해 긴 문서에 대한 효율적, 추상적인 검색이 가능하며, 다중 단계 추론 QA에서 특히 뛰어난 성능을 보입니다.
다만 구현 비용과 동적 문서 환경에서의 유연성은 향후 연구 과제로 남아 있으며, adRAP 및 postQFRAP 같은 후속 연구들이 이를 개선하고자 합니다.

김소은

개발자

이전 포스트

RAG - Reranker

다음 포스트