‼️ 개인 학습 내용으로, 오류가 있을 수 있습니다.
논문 URL - https://arxiv.org/abs/2501.09136
쿼리 제출 및 평가:사용자 쿼리를 마스터 에이전트가 수신·분석하여 적합한 정보 소스 결정
지식 소스 선택:
데이터 통합 및 LLM 종합:선택된 소스에서 수집된 데이터를 LLM에 전달, 통합·분석
출력 생성:원본 쿼리에 대한 종합적 답변 생성(참조 문헌 포함 가능)
개념 : 단일 에이전트 시스템의 한계를 극복하기 위해 전문화된 다중 에이전트를 활용하는 모듈식 아키텍처이다.
특징 : 워크플로우와 다양한 쿼리 유형을 효율적으로 처리하며, 병렬 처리와 도메인 특화를 통해 성능을 극대화한다.
워크플로우
쿼리 제출: 사용자 질의를 중앙 조정 에이전트(Coordinator Agent)가 수신·분석
전문 에이전트 배정: 쿼리 유형에 따라 특화된 검색 에이전트에게 작업을 분배
에이전트 1: 구조화된 쿼리(SQL DB 연동)
에이전트 2: 비정형 데이터 검색(벡터 검색)
에이전트 3: 실시간 웹 정보 수집
에이전트 4: 사용자 프로필 기반 추천 시스템
병렬 데이터 검색: 각 에이전트가 전용 도구(Text-to-SQL, 웹 검색 등)를 활용해 데이터를 병렬로 검색
데이터 통합: LLM이 수집된 데이터를 종합해 일관된 응답을 생성
결과 전달: 사용자에게 실행 가능한 형식으로 최종 응답을 제공
개념: 계층적 에이전트 RAG 시스템은 다단계 구조를 통해 정보 검색과 처리를 수행하는 방식이다.
특징 : 상위 에이전트가 하위 에이전트를 감독·지휘하며, 복잡한 쿼리를 가장 적합한 자원에 할당해 효율성과 전략적 의사결정을 향상시킨다.
워크플로우:
장점:
도전 과제:
개념: Corrective RAG는 검색된 문서와 생성된 응답을 지능형 에이전트를 통해 반복적으로 평가·수정하여 오류를 최소화하고 응답의 관련성과 정확성을 극대화하는 시스템이다.
핵심 원리:
주요 구성 에이전트:
개념 : 쿼리 복잡도에 따라 동적으로 검색 및 응답 전략을 조정하는 LLM 기반 시스템이다.
특징 : 기존의 정적 검색 방식과 달리, Adaptive RAG는 쿼리 난이도를 분류하고 이에 맞는 최적의 처리 방식을 선택한다.
핵심 원리
주요 구성 요소
장점
개념 : Graph-Based Agentic RAG는 구조화된 그래프 지식베이스와 비정형 문서 검색을 통합하여 Retrieval-Augmented Generation(RAG) 시스템의 추론 능력과 검색 정확도를 향상시키는 새로운 에이전트 기반 아키텍처이다.
주요 시스템: Agent-G
핵심 아이디어:
구성 요소:
특징 및 장점:
개념 : 기존 RAG 시스템에 그래프 기반 검색 메커니즘을 통합하여 다중 홉(multi-hop) 검색 시나리오에서 성능을 크게 향상시키는 에이전트 기반 프레임워크이다.
핵심 아이디어
주요 구성 요소
특징 및 장점
개념 : 전통적인 RAG 방식을 확장하여 문서 중심의 복잡한 지식 작업을 자동화하는 시스템이다.
특징 : ADW는 문서 파싱, 검색, 추론, 구조화된 출력 및 지능형 에이전트의 조율을 통합해, 문서 처리 전 과정을 체계적으로 관리한다.
주요 워크플로우
문서 파싱 및 구조화 :
프로세스 상태 유지
지식 검색
에이전트 조율
실행 가능한 출력 생성
Agentic RAG 시스템은 환자별 데이터와 최신 의학 연구를 통합하여 임상진단 및 치료계획에 필요한 실시간 임상지침, 의료 문헌, 환자 이력을 신속하게 검색·제공한다.
사례 : 환자 사례 요약 생성
전자 건강기록(EHR)과 최신 의학 문헌을 통합해 환자 사례 요약을 자동 생성하며, 이를 통해 임상의가 더 빠르고 정확한 결정을 내릴 수 있도록 지원한다.
주요 효과
Agentic RAG 시스템은 법률 문서 분석과 의사결정 과정을 혁신하며, 신속한 문서 분석과 자동화된 계약 검토를 지원한다.
사례: 계약서 검토
핵심 효과
Agentic RAG 시스템은 실시간 데이터, 과거 트렌드, 예측 모델링을 통합해 투자, 시장 분석, 리스크 관리 등 금융 의사결정에 즉각적이고 실행 가능한 인사이트를 제공한다.
사례: 자동차 보험 청구 자동화
자동차 보험에서 Agentic RAG는 사고 데이터와 보험 약관을 결합해 청구 추천을 자동 생성하며, 규제 준수도 보장한다.
핵심 효과
LangChain & LangGraph: RAG 파이프라인 구축을 위한 모듈형 컴포넌트와, 반복·병렬·상태 관리 및 인간 개입이 가능한 그래프 기반 워크플로우를 제공한다.
LlamaIndex: Agentic Document Workflow(ADW)로 문서 처리와 추론을 자동화하며, 메타 에이전트가 하위 에이전트를 관리해 복잡한 문서 기반 업무를 처리한다.
Hugging Face Transformers & Qdrant: 임베딩·생성 모델과 적응형 벡터 검색을 결합해 다양한 검색 전략을 지원한다.
CrewAI & AutoGen: 계층적·순차적 멀티에이전트 구조, 메모리 시스템, 도구 통합, 코드 생성 및 의사결정 지원에 특화되어 있다.
OpenAI Swarm Framework: 경량 멀티에이전트 오케스트레이션을 위한 교육용 프레임워크다.
Vertex AI: 구글의 플랫폼으로, Agentic RAG 구축·배포·확장과 고급 AI 기반 검색·의사결정 워크플로우를 지원한다.
Semantic Kernel: MS의 오픈소스 SDK로, LLM 기반 자연어 이해, 작업 자동화, 의사결정형 에이전트 개발을 지원한다.
Amazon Bedrock: Agentic RAG 워크플로우 구현을 위한 강력한 플랫폼을 제공한다.
IBM Watson: watsonx.ai와 Granite 모델을 활용해 외부 정보 통합 및 복잡한 쿼리 응답 정확도를 높인다.
Neo4j & Vector Databases: 그래프 및 벡터 데이터베이스(Weaviate, Pinecone, Milvus, Qdrant 등)로 복잡한 관계 처리와 유사도 검색을 지원한다.
에이전트 및 그래프 기반 확장형 RAG의 성능 평가를 위해 다양한 벤치마크와 데이터셋이 활용된다.
이들은 검색, 추론, 생성 능력을 표준화된 과제로 측정하며, 실제 적용에 중요한 역할을 한다.
주요 벤치마크 및 데이터셋
BEIR: 다양한 도메인(생명정보, 금융, QA 등)에서 임베딩 모델의 정보 검색 성능을 평가하는 대표적 벤치마크다.
MS MARCO: 패시지 랭킹과 질문응답 중심의 대규모 벤치마크로, RAG 시스템의 밀집 검색 성능 평가에 널리 사용된다.
TREC: 패시지·문서 검색 및 랭킹 품질을 평가하는 데이터셋을 제공한다.
MuSiQue, 2WikiMultihopQA, HotpotQA: 멀티홉 추론과 다중 문서 연결 능력을 평가하는 QA 데이터셋이다.
AgentG: 에이전트 기반 RAG의 동적 정보 융합 능력을 평가한다.
RAGBench: 산업별 다양한 RAG 과제와 10만 개 예시, 설명 가능한 평가 지표(TRACe)를 제공하는 대규모 벤치마크다.
BERGEN, FlashRAG Toolkit, GNN-RAG: 표준화된 실험, 다양한 RAG 방법론, 그래프 기반 RAG 평가를 지원한다.