[논문 리뷰 - 2] Corrective Retrieval Augmented Generation

shanny·2025년 5월 15일

논문 리뷰

목록 보기
23/42

‼️ 개인 학습 내용으로, 오류가 있을 수 있습니다.

논문 URL - https://arxiv.org/pdf/2401.15884

Introduction

  • LLM은 뛰어난 언어 이해 및 생성 능력을 갖췄지만, 내부 지식만으로는 항상 정확한 정보를 제공하지 못해 환각과 사실 오류 문제가 발생할 수 있다.

  • RAG는 외부 지식 코퍼스에서 관련 문서를 검색해 입력에 추가함으로써, LLM의 응답 정확성과 신뢰성을 높인다. RAG는 LLM의 한계를 보완하는 실질적인 방법이지만, 그 효과는 검색된 문서의 관련성과 정확성에 크게 좌우된다. 즉, 검색된 정보가 부적절하거나 부정확할 경우, 생성 결과 역시 신뢰도가 떨어질 수 있다.

  • 생성 과정이 검색된 지식에 크게 의존함에 따라, 검색이 실패하거나 부정확한 결과를 반환하는 상황에서 모델의 성능과 행동에 대한 우려가 제기된다. 낮은 품질의 검색기는 많은 무관한 정보를 도입하여, 모델이 정확한 지식을 얻지 못하게 하거나 환각과 같은 문제를 유발할 수 있다.

  • 그러나 대부분의 기존 RAG 방식은 검색된 문서의 관련성 여부와 상관없이 무차별적으로 이를 활용한다. 또한, 현재 방법들은 검색 및 활용 과정에서 전체 문서를 참조 지식으로 취급하지만, 실제로는 이 문서들 중 상당 부분이 생성에 불필요한 정보로, 모두 동일하게 참고되어서는 안 된다.

  • 위와 같은 문제를 해결하기 위해, 본 논문은 검색기가 부정확한 결과를 반환하는 상황에 주목한다. 이를 위해 검색 결과를 스스로 교정하고, 문서 활용도를 높여 생성 성능을 개선하는 새로운 방법인 CRAG(Corrective Retrieval-Augmented Generation)를 제안한다.

  • 경량 검색 평가기(retrieval evaluator)를 도입하여 쿼리에 대해 검색된 문서들의 전반적인 품질을 평가하도록 설계한다. 이 평가는 검색된 문서의 관련성과 신뢰도를 검토·평가함으로써, RAG의 생성 품질을 높이는 핵심 역할을 한다. 평가 결과를 바탕으로 신뢰도(confidence degree)를 산출하며, 이에 따라 {정답(Correct), 부정확(Incorrect), 모호(Ambiguous)}의 세 가지 액션 중 하나가 트리거된다.

  • 부정확 또는 모호로 판단될 경우, 정적 코퍼스의 한계를 극복하고 정보의 다양성과 범위를 확장하기 위해 대규모 웹 검색이 추가적으로 수행된다. 이를 통해 더 폭넓고 최신의 정보를 확보하여 초기 검색 문서를 보완한다.

  • 또한, 검색된 문서 내에서 RAG에 불필요한 중복이나 비본질적 맥락을 제거하기 위해 분해-재구성(decompose-then-recompose) 알고리즘을 적용한다. 이 알고리즘은 핵심 정보를 최적화해 추출하고, 비필수 요소의 포함을 최소화하여 검색 데이터의 활용도를 높인다.

  • 결과적으로, 이 과정은 검색된 정보의 신뢰성과 관련성을 높이고, 생성 모델이 더 정확하고 유익한 답변을 생성할 수 있도록 돕는다.

  • CRAG는 플러그앤플레이 방식으로, 기존 RAG 및 Self-RAG와 같은 다양한 RAG 기반 접근법에 손쉽게 적용할 수 있다. 네 가지 데이터셋(PopQA, Biography, Pub Health, Arc-Challenge)에서 실험한 결과, CRAG는 표준 RAG와 최신 Self-RAG 모두에서 성능을 크게 향상시켜, 단문 및 장문 생성 작업 전반에 걸쳐 뛰어난 범용성을 입증했다.

  • 본 논문의 주요 성과

    1. 검색기가 부정확한 결과를 반환하는 상황을 분석하고, RAG의 견고성을 높이기 위한 교정 전략을 처음으로 제안하였다.

    2. 자동 자기 교정 및 검색 문서의 효율적 활용 능력을 높이는 플러그앤플레이 방식의 CRAG 기법을 개발하였다.

    3. 다양한 실험을 통해 CRAG가 RAG 기반 접근법에 잘 적용되며, 단문 및 장문 생성 작업 모두에서 뛰어난 범용성을 보임을 입증하였다.

Conclusion

  • 이 논문은 RAG 기반 접근법에서 검색이 실패할 경우, 생성형 언어모델이 부정확하거나 오해를 불러일으키는 정보를 노출하게 되는 문제를 다룬다. 이를 해결하기 위해 Corrective Retrieval Augmented Generation(CRAG)을 제안하며, 경량 검색 평가기를 도입해 검색 결과의 신뢰도를 평가하고 세 가지 검색 액션을 구분하여 적용한다.

  • 웹 검색과 최적화된 지식 활용을 추가함으로써, CRAG는 자동 자기 교정 능력과 검색 문서의 효율적 활용을 크게 향상시켰다. 다양한 실험을 통해 CRAG의 RAG 기반 접근법 적응성과 단·장문 생성 작업에 대한 범용성이 입증되었다.

  • 다만, 외부 검색 평가기를 미세 조정해야 하는 한계가 있으며, 향후에는 이 평가기 없이 LLM 자체가 더 나은 검색 평가 능력을 갖추는 방향으로 연구를 진행할 예정이다.

profile
데이터 분석가

0개의 댓글