RAPTOR: Recursive Abstractive Processing for Tree‑Organized Retrieval (arXiv:2401.18059, 제출일: 2024년 1월 31일)
핵심 아이디어
- 기존 RAG(Retrieval-Augmented Generation) 방식은 문서에서 짧고 연속된 조각만을 검색하므로 문맥의 전체적인 이해가 어려움 (arXiv, LangChain).
- RAPTOR 는 문서를 작은 텍스트 청크로 나눈 뒤, 이를 재귀적으로 임베딩, 클러스터링, 요약하여 하향적 요약 트리(tree of summaries) 구조를 만듭니다 (arXiv).
- 추론 시에는 이 트리 구조에서 필요한 요약 수준(level of abstraction) 에서 정보를 검색함으로써, 문서 전체를 아우르는 맥락 활용이 가능해집니다 (arXiv).
성능 및 효과
- 제어된 실험 결과, RAPTOR를 사용한 검색 방식이 전통적인 RAG 모델 대비 여러 작업에서 현저한 성능 향상을 보여줌 (arXiv).
- 특히 다중 단계 추론(multi-step reasoning) 이 필요한 질문 응답(QA) 과제에서 GPT‑4와 결합 시, QuALITY 벤치마크의 절대 정확도(accuracy)를 20%p 향상시켰습니다 (arXiv).
기술적 구성 및 파이프라인
- 문서를 여러 개의 청크(text chunks) 로 분할.
- 각 청크를 임베딩 → 유사한 청크들은 클러스터링 → 클러스터 단위로 요약 생성.
- 요약된 결과를 다시 묶고 요약하는 재귀적 요약(recursive summarization) 과정을 반복.
- 이 과정을 통해 다계층 구조의 요약 트리 완성.
- 추론 시 적절한 계층에서 검색 가능—짧은 답변을 원하면 낮은 레벨, 깊이 있는 이해가 필요하면 높은 레벨 활용.
장점 & 한계
| 항목 | 내용 |
|---|
| 장점 | • 전체 문서 맥락 반영 가능 • 다양한 추론 수준 선택적 검색 • 다중 단계 추론 QA에서 우수한 성능 |
| 한계 | • 트리 구조 생성 및 유지에 따른 계산/메모리 오버헤드 존재 • 문서 추가/삭제가 빈번한 동적 데이터 환경에는 재구성 비용이 높음 (arXiv) |
동적 파일셋 환경을 위한 후속 연구로 adRAP (adaptive RAPTOR)가 도입되었으며, 문서 추가/삭제 시 전체 트리를 재컴퓨팅하지 않고 증분 업데이트 방식으로 처리하는 방법을 제안했습니다 (arXiv).
또한, postQFRAP라는 후처리(query‑focused recursive abstractive processing) 방식도 제시됐습니다. 이 방식은 기존 RAG 파이프라인에 블랙박스처럼 덧붙일 수 있는 레이어로서, 검색된 정보에 대해 쿼리 중심의 요약을 재귀적으로 수행함으로써 질을 높이는 접근 방식입니다 (arXiv).
전체 요약
- RAPTOR는 문서 이해를 위한 RAG 접근의 한계를 극복하기 위해 계층적 요약 트리 구조를 활용합니다.
- 이를 통해 긴 문서에 대한 효율적, 추상적인 검색이 가능하며, 다중 단계 추론 QA에서 특히 뛰어난 성능을 보입니다.
- 다만 구현 비용과 동적 문서 환경에서의 유연성은 향후 연구 과제로 남아 있으며, adRAP 및 postQFRAP 같은 후속 연구들이 이를 개선하고자 합니다.