
Fusion-in-Decoder (FiD)와 Parallel Context Windows (PCW) 같은 기존 연구를 기반으로 Sparse RAG 내용 정리 및 번역
Speculative RAG 방법과 내용 요약 Speculative RAG는 기존의 Retrieval-Augmented Generation(RAG) 방식의 한계를 보완하고, 특히 정보 집약적인 질문에서 더 높은 정확도와 효율성을 제공하는 방법. 정리 및 번역

LongRAG을 제안. 이는 '긴 검색기'와 '긴 독자'로 구성됩니다. 단위를 기존보다 30배 길게(4,000 토큰 단위) 처리하여 검색기에서 필요한 총 단위 수를 줄이고, 단 몇 개의 상위 단위(8개 미만)를 사용하여 강력한 검색성능을 달성합니다.

내부 암기와 다를 때 외부에서 검색된 비모수적 지식의 정확성을 평가하는 데 어려움을 겪기 때문에 응답 생성 중에 *지식 충돌이* 발생합니다. 이를 위해 검색 관련성을 기반으로 다중 소스 지식을 적응적으로 활용하기 위한 가볍고 효과적인 정렬 방법인 RPO를 제안합니다.