[논문 리뷰 - 4] Agentic Retrieval-Augmented Generation: A Survey on Agentic RAG

shanny·2025년 5월 4일

논문 리뷰

목록 보기
20/42

‼️ 개인 학습 내용으로, 오류가 있을 수 있습니다.

논문 URL - https://arxiv.org/abs/2501.09136

Agentic RAG 시스템 분류

단일 에이전트 Agentic RAG 시스템

  • 워크플로우
  1. 쿼리 제출 및 평가:사용자 쿼리를 마스터 에이전트가 수신·분석하여 적합한 정보 소스 결정

  2. 지식 소스 선택:

    • 구조화 DB: 텍스트-to-SQL 엔진 활용(예: PostgreSQL, MySQL)
    • 비정형 데이터: 벡터 기반 검색으로 PDF·문서 등 추출
    • 웹 검색: 실시간 온라인 데이터 접근
    • 추천 시스템: 맞춤형 제안 제공
  3. 데이터 통합 및 LLM 종합:선택된 소스에서 수집된 데이터를 LLM에 전달, 통합·분석

  4. 출력 생성:원본 쿼리에 대한 종합적 답변 생성(참조 문헌 포함 가능)

  • 핵심 특징 및 장점
    • 중앙 집중식 단순성: 단일 에이전트가 모든 검색·라우팅 관리 → 설계·운용 용이
    • 효율성: 적은 자원으로 빠른 쿼리 처리
    • 동적 라우팅: 실시간 쿼리 평가를 통한 최적 소스 선택
    • 다양한 도구 지원: 구조화/비구조화 데이터 소스 및 외부 API 통합
    • 단순 시스템 적합성: 문서 검색·SQL 기반 워크플로우 등 정의된 작업에 이상적

멀티 에이전트 Agentic RAG 시스템

  • 개념 : 단일 에이전트 시스템의 한계를 극복하기 위해 전문화된 다중 에이전트를 활용하는 모듈식 아키텍처이다.

  • 특징 : 워크플로우와 다양한 쿼리 유형을 효율적으로 처리하며, 병렬 처리와 도메인 특화를 통해 성능을 극대화한다.

  • 워크플로우

    1. 쿼리 제출: 사용자 질의를 중앙 조정 에이전트(Coordinator Agent)가 수신·분석

    2. 전문 에이전트 배정: 쿼리 유형에 따라 특화된 검색 에이전트에게 작업을 분배

      에이전트 1: 구조화된 쿼리(SQL DB 연동)
      에이전트 2: 비정형 데이터 검색(벡터 검색)
      에이전트 3: 실시간 웹 정보 수집
      에이전트 4: 사용자 프로필 기반 추천 시스템

    3. 병렬 데이터 검색: 각 에이전트가 전용 도구(Text-to-SQL, 웹 검색 등)를 활용해 데이터를 병렬로 검색

    4. 데이터 통합: LLM이 수집된 데이터를 종합해 일관된 응답을 생성

    5. 결과 전달: 사용자에게 실행 가능한 형식으로 최종 응답을 제공

계층적 Agentic RAG 시스템

  • 개념: 계층적 에이전트 RAG 시스템은 다단계 구조를 통해 정보 검색과 처리를 수행하는 방식이다.

  • 특징 : 상위 에이전트가 하위 에이전트를 감독·지휘하며, 복잡한 쿼리를 가장 적합한 자원에 할당해 효율성과 전략적 의사결정을 향상시킨다.

  • 워크플로우:

    • 사용자 쿼리 접수 및 상위 에이전트가 초기 평가 및 작업 분배
    • 쿼리 복잡도와 맥락에 따라 우선순위 결정 및 하위 에이전트에 작업 위임
    • 하위 에이전트들은 각자 전문화된 검색 방법(SQL DB, 웹 검색 등)을 독립적으로 수행
    • 상위 에이전트가 하위 에이전트 결과를 수집·통합하여 일관된 응답 생성
    • 최종 응답을 사용자에게 전달
  • 장점:

    • 전략적 우선순위 지정: 쿼리 특성에 따른 데이터 소스 및 작업 우선순위 조정 가능
    • 확장성: 여러 계층에 걸친 작업 분배로 복잡한 쿼리도 효율적 처리
    • 향상된 의사결정: 상위 에이전트의 감독으로 응답 정확도 및 일관성 증대
  • 도전 과제:

    • 다중 계층 간 통신 및 조율의 복잡성 증가
    • 작업 분배의 효율적 자원 관리 필요, 병목 현상 방지 어려움

Agentic Corrective RAG

  • 개념: Corrective RAG는 검색된 문서와 생성된 응답을 지능형 에이전트를 통해 반복적으로 평가·수정하여 오류를 최소화하고 응답의 관련성과 정확성을 극대화하는 시스템이다.

  • 핵심 원리:

    • 검색된 문서의 적합성을 평가하고, 기준에 미달하는 문서는 수정 조치가 이루어진다.
    • 쿼리를 의미적으로 재구성하여 검색 품질을 향상시킨다.
    • 필요한 경우 외부 웹 검색 등 추가 데이터 소스를 동적으로 활용한다.
    • 최종적으로 검증된 정보를 통합해 일관성 있는 답변을 생성한다.
  • 주요 구성 에이전트:

  1. 컨텍스트 검색 에이전트: 초기 문서 검색 담당
  2. 적합성 평가 에이전트: 문서 관련성 평가 및 오류 문서 식별
  3. 쿼리 재구성 에이전트: 검색 쿼리 최적화 및 수정
  4. 외부 지식 검색 에이전트: 추가 정보 수집
  5. 응답 종합 에이전트: 최종 답변 생성
  • 장점:
    • 반복적 자기 수정으로 높은 정확도 보장
    • 실시간 웹 검색과 쿼리 개선을 통한 적응성 강화
    • 모듈화된 에이전트 구조로 효율적이고 확장 가능
    • 환각(hallucination) 및 오정보 위험 최소화

Adaptive Retrieval-Augmented Generation (Adaptive RAG)

  • 개념 : 쿼리 복잡도에 따라 동적으로 검색 및 응답 전략을 조정하는 LLM 기반 시스템이다.

  • 특징 : 기존의 정적 검색 방식과 달리, Adaptive RAG는 쿼리 난이도를 분류하고 이에 맞는 최적의 처리 방식을 선택한다.

  • 핵심 원리

    • 간단한 쿼리: 사실 기반 질문 등은 별도의 검색 없이 LLM의 내장 지식으로 바로 답변 생성
    • 단순 쿼리: 최소한의 문서 검색을 통해 필요한 정보를 한 단계만 검색
    • 복잡 쿼리: 다단계 검색과 반복적 추론을 통해 심층적이고 포괄적인 답변 제공
  • 주요 구성 요소

    • 분류기(Classifier): 작은 모델이 쿼리 복잡도를 예측해 적절한 처리 전략을 결정
    • 동적 전략 선택: 쿼리 유형에 따라 검색 단계 수 및 방법을 조절
    • LLM 통합: 검색된 정보를 종합해 일관성 있는 응답 생성, 복잡 쿼리는 반복적 상호작용으로 정제
  • 장점

    • 동적 적응성: 쿼리 특성에 맞춘 최적화로 효율성과 정확도 극대화
    • 자원 효율성: 단순 쿼리에 불필요한 검색 회피로 비용 절감
    • 높은 정확도: 복잡 쿼리도 반복적 개선으로 정밀한 답변 가능
    • 확장성: 도메인 특화 도구나 외부 API 통합 가능

그래프 기반 Agentic RAG

  • 개념 : Graph-Based Agentic RAG는 구조화된 그래프 지식베이스와 비정형 문서 검색을 통합하여 Retrieval-Augmented Generation(RAG) 시스템의 추론 능력과 검색 정확도를 향상시키는 새로운 에이전트 기반 아키텍처이다.

  • 주요 시스템: Agent-G

  • 핵심 아이디어:

    • 그래프 지식베이스를 활용해 관계, 계층, 연결성을 추출(예: 의료 분야의 질병-증상 매핑)
    • 전통적 텍스트 검색으로 비정형 문서에서 맥락 정보를 보완
    • 비평가(Critic) 모듈이 검색 결과의 적합성 및 품질을 평가하고, 낮은 신뢰도의 결과는 재검색 및 수정
    • 피드백 루프를 통해 반복적으로 검색과 응답을 개선
  • 구성 요소:

    • Retriever Bank: 그래프 기반 및 비정형 데이터 검색을 담당하는 모듈형 에이전트 집합
    • Critic Module: 검색 데이터의 적합성 검증 및 재검색 유도
    • Dynamic Agent Interaction: 다양한 데이터 타입을 통합하는 에이전트 간 협업
    • LLM Integration: 검증된 데이터를 종합해 일관된 응답 생성
  • 특징 및 장점:

    • 향상된 추론 능력: 그래프의 구조적 관계와 문서의 맥락 정보 결합
    • 동적 적응성: 쿼리 요구에 따라 검색 전략 유연 조정
    • 정확도 개선: 비평가 모듈로 불필요하거나 부정확한 정보 최소화
    • 확장성: 새로운 전문 에이전트 추가 가능.

GeAR(Graph-enhanced Agent for Retrieval-augmented Generation)

  • 개념 : 기존 RAG 시스템에 그래프 기반 검색 메커니즘을 통합하여 다중 홉(multi-hop) 검색 시나리오에서 성능을 크게 향상시키는 에이전트 기반 프레임워크이다.

  • 핵심 아이디어

    • 그래프 확장(Graph Expansion): 기존 검색기(BM25 등)를 보완하여, 엔티티 간 복잡한 관계와 의존성을 포착할 수 있도록 그래프 구조 데이터를 활용해 검색 범위를 확장한다.
    • 에이전트 프레임워크: 그래프 확장을 활용하는 에이전트들이 동적으로 검색 작업을 관리하며, 쿼리 복잡도에 따라 자율적으로 검색 경로를 결정한다.
  • 주요 구성 요소

    • 그래프 확장 모듈: 그래프 기반 데이터를 검색 과정에 통합해 다중 홉 쿼리 처리 능력 강화
    • 에이전트 기반 검색: 쿼리 복잡도에 맞춰 검색 전략을 동적으로 선택·조합하는 에이전트 시스템
    • LLM 통합: 그래프 확장으로 풍부해진 정보를 LLM과 결합해 일관되고 맥락에 맞는 응답 생성
  • 특징 및 장점

    • 향상된 다중 홉 검색: 복잡한 쿼리에서 여러 연결된 정보 조합 가능
    • 동적 의사결정: 에이전트가 검색 전략을 자율적으로 조정해 효율성과 정확도 개선
    • 정확도 향상: 구조화된 그래프 데이터 활용으로 검색 정보의 정밀도 증가
    • 확장성: 모듈화된 에이전트 구조로 새로운 검색 전략과 데이터 소스 추가 용이

Agentic Document Workflows (ADW)

  • 개념 : 전통적인 RAG 방식을 확장하여 문서 중심의 복잡한 지식 작업을 자동화하는 시스템이다.

  • 특징 : ADW는 문서 파싱, 검색, 추론, 구조화된 출력 및 지능형 에이전트의 조율을 통합해, 문서 처리 전 과정을 체계적으로 관리한다.

  • 주요 워크플로우

  1. 문서 파싱 및 구조화 :

    • LlamaParse 같은 엔터프라이즈급 도구를 사용해 인보이스 번호, 날짜, 공급업체 정보 등 핵심 데이터 필드 추출
    • 추출된 데이터를 구조화하여 후속 처리에 활용
  2. 프로세스 상태 유지

    • 문서 처리 단계별 상태와 맥락을 추적해 일관성과 연속성 보장
  3. 지식 검색

    • LlamaCloud 등 외부 지식베이스 또는 벡터 인덱스에서 관련 정보 검색
    • 도메인별 실시간 가이드라인 활용으로 의사결정 지원
  4. 에이전트 조율

    • 비즈니스 규칙 적용, 다단계 추론 수행, 실행 가능한 권고안 생성
    • 파서, 검색기, 외부 API 등 다양한 구성요소를 통합 조정
  5. 실행 가능한 출력 생성

    • 특정 사용 사례에 맞춘 구조화된 보고서 및 권고안 제공
  • 장점
    • 상태 유지: 문서 처리 전 과정에서 맥락과 상태 관리
    • 복잡한 다단계 조율: 여러 컴포넌트와 외부 도구 간 원활한 협력
    • 도메인 특화 지능: 맞춤형 비즈니스 규칙과 가이드라인 적용
    • 확장성: 모듈식 에이전트 통합으로 대규모 문서 처리 지원
    • 생산성 향상: 반복 업무 자동화와 인간 전문성 보조

Agent RAG 활용 사례

01. 고객 지원 및 가상 비서

  • 문제점: 기존 챗봇은 정적 지식 기반에 의존해 구체성 부족 및 구식 응답 문제 존재
  • 해결 방안: 에이전틱 RAG는 실시간 데이터(광고주 데이터, 캠페인 성과 등)를 동적으로 검색·통합해 맞춤형 응답 생성
  • 주요 장점:
    • 맥락 인식: 사용자 문의 맥락에 맞춘 개인화 응답 제공
    • 실시간 적응성: 가격 변동, 서비스 장애 등 변화된 데이터 즉시 반영
    • 업무 효율화: 복잡한 문의 자동 처리로 인력 부담 감소(예: 주문 상태 업데이트, 환불 처리)

02. 보건 의료와 맞춤 의료

  • Agentic RAG 시스템은 환자별 데이터와 최신 의학 연구를 통합하여 임상진단 및 치료계획에 필요한 실시간 임상지침, 의료 문헌, 환자 이력을 신속하게 검색·제공한다.

  • 사례 : 환자 사례 요약 생성
    전자 건강기록(EHR)과 최신 의학 문헌을 통합해 환자 사례 요약을 자동 생성하며, 이를 통해 임상의가 더 빠르고 정확한 결정을 내릴 수 있도록 지원한다.

  • 주요 효과

    • 개인 맞춤형 진료: 환자별 상황에 맞는 권고안 제공
    • 시간 효율성: 관련 연구와 정보를 신속히 검색해 의료진의 시간 절약
    • 정확성: 최신 근거와 환자 특성을 반영한 권고 보장

03. 법률 및 계약 분석

  • Agentic RAG 시스템은 법률 문서 분석과 의사결정 과정을 혁신하며, 신속한 문서 분석과 자동화된 계약 검토를 지원한다.

  • 사례: 계약서 검토

    • 계약서를 분석해 핵심 조항을 추출하고, 위험 요소를 식별한다.
    • 시맨틱 검색과 법률 지식 그래프를 결합해 반복적이고 복잡한 계약 검토를 자동화하며, 준법성과 리스크를 관리한다.
  • 핵심 효과

    • 위험 식별: 표준 조항에서 벗어난 내용을 자동으로 표시한다.
    • 효율성: 계약 검토 소요 시간을 크게 단축한다.
    • 확장성: 대량의 계약서를 동시에 처리한다.

04. 금융 및 리스크 분석

  • Agentic RAG 시스템은 실시간 데이터, 과거 트렌드, 예측 모델링을 통합해 투자, 시장 분석, 리스크 관리 등 금융 의사결정에 즉각적이고 실행 가능한 인사이트를 제공한다.

  • 사례: 자동차 보험 청구 자동화
    자동차 보험에서 Agentic RAG는 사고 데이터와 보험 약관을 결합해 청구 추천을 자동 생성하며, 규제 준수도 보장한다.

  • 핵심 효과

    • 실시간 분석: 라이브 시장 데이터 기반 인사이트 제공
    • 리스크 완화: 예측 분석과 다단계 추론으로 잠재 위험 식별
    • 의사결정 강화: 과거와 실시간 데이터를 결합해 전략 수립 지원
    • 확장성: 대량 데이터와 복잡한 규제 환경에도 유연하게 대응

05. 교육 및 개인화 학습

  • Agentic RAG 시스템은 학습자의 수준과 선호에 맞춘 설명, 학습 자료, 피드백을 생성해 적응형 학습을 실현한다.
  • 연구 논문 요약 등 고등교육 분야에서 여러 소스의 핵심 내용을 통합·정리해 연구 효율성과 품질을 높인다.
  • 핵심 효과
    • 맞춤형 학습 경로 제공
    • 대화형 설명 및 개인별 피드백
    • 다양한 교육 환경에서 대규모 확장 지원

06. 그래프 기반 멀티모달 워크플로우

  • Graph-Enhanced Agentic RAG(GEAR)는 텍스트, 이미지, 영상 등 다양한 데이터 소스를 통합해 마케팅 등에서 트렌드 분석, 고객 선호, 경쟁사 분석 등 다각적 보고서를 생성한다.
  • 핵심 효과
    • 텍스트·이미지·영상 등 멀티모달 데이터 통합
    • 창의적 아이디어 및 솔루션 생성
    • 시장 변화와 고객 요구에 유연하게 대응

Agentic RAG의 Tool과 Framework

  • Agentic RAG 시스템은 검색, 생성, 에이전트 지능을 결합해 복잡한 의사결정과 적응형 워크플로우를 지원하며, 다음과 같은 주요 도구와 프레임워크가 활용된다.
  1. LangChain & LangGraph: RAG 파이프라인 구축을 위한 모듈형 컴포넌트와, 반복·병렬·상태 관리 및 인간 개입이 가능한 그래프 기반 워크플로우를 제공한다.

  2. LlamaIndex: Agentic Document Workflow(ADW)로 문서 처리와 추론을 자동화하며, 메타 에이전트가 하위 에이전트를 관리해 복잡한 문서 기반 업무를 처리한다.

  3. Hugging Face Transformers & Qdrant: 임베딩·생성 모델과 적응형 벡터 검색을 결합해 다양한 검색 전략을 지원한다.

  4. CrewAI & AutoGen: 계층적·순차적 멀티에이전트 구조, 메모리 시스템, 도구 통합, 코드 생성 및 의사결정 지원에 특화되어 있다.

  5. OpenAI Swarm Framework: 경량 멀티에이전트 오케스트레이션을 위한 교육용 프레임워크다.

  6. Vertex AI: 구글의 플랫폼으로, Agentic RAG 구축·배포·확장과 고급 AI 기반 검색·의사결정 워크플로우를 지원한다.

  7. Semantic Kernel: MS의 오픈소스 SDK로, LLM 기반 자연어 이해, 작업 자동화, 의사결정형 에이전트 개발을 지원한다.

  8. Amazon Bedrock: Agentic RAG 워크플로우 구현을 위한 강력한 플랫폼을 제공한다.

  9. IBM Watson: watsonx.ai와 Granite 모델을 활용해 외부 정보 통합 및 복잡한 쿼리 응답 정확도를 높인다.

  10. Neo4j & Vector Databases: 그래프 및 벡터 데이터베이스(Weaviate, Pinecone, Milvus, Qdrant 등)로 복잡한 관계 처리와 유사도 검색을 지원한다.

Benchmarks and Datasets

  • 에이전트 및 그래프 기반 확장형 RAG의 성능 평가를 위해 다양한 벤치마크와 데이터셋이 활용된다.

  • 이들은 검색, 추론, 생성 능력을 표준화된 과제로 측정하며, 실제 적용에 중요한 역할을 한다.

  • 주요 벤치마크 및 데이터셋

  1. BEIR: 다양한 도메인(생명정보, 금융, QA 등)에서 임베딩 모델의 정보 검색 성능을 평가하는 대표적 벤치마크다.

  2. MS MARCO: 패시지 랭킹과 질문응답 중심의 대규모 벤치마크로, RAG 시스템의 밀집 검색 성능 평가에 널리 사용된다.

  3. TREC: 패시지·문서 검색 및 랭킹 품질을 평가하는 데이터셋을 제공한다.

  4. MuSiQue, 2WikiMultihopQA, HotpotQA: 멀티홉 추론과 다중 문서 연결 능력을 평가하는 QA 데이터셋이다.

  5. AgentG: 에이전트 기반 RAG의 동적 정보 융합 능력을 평가한다.

  6. RAGBench: 산업별 다양한 RAG 과제와 10만 개 예시, 설명 가능한 평가 지표(TRACe)를 제공하는 대규모 벤치마크다.

  7. BERGEN, FlashRAG Toolkit, GNN-RAG: 표준화된 실험, 다양한 RAG 방법론, 그래프 기반 RAG 평가를 지원한다.

profile
데이터 분석가

0개의 댓글