Advanced RAG 개념

TaeJong Kim·2025년 9월 26일

출처: https://learn.microsoft.com/en-us/azure/developer/ai/advanced-retrieval-augmented-generation

Advanced RAG 파이프라인 요약

Advanced RAG는 기본 RAG(Naive RAG)의 한계를 극복하기 위해, 전체 과정을 수집(Ingestion), 추론(Inference), 평가(Evaluation)의 3단계로 나누어 각 부분을 체계적으로 최적화한 모델입니다.

  1. 수집 (Ingestion) - DB 구축 단계
    • 콘텐츠 전처리: 데이터 형식을 통일하고, 불필요한 정보를 제거하며, 표·이미지 등 복합 콘텐츠와 메타데이터를 추출
    • 청킹 (Chunking) 전략: 문서를 의미 단위(청크)로 분할
      • 핵심 기술:
        • 청크 크기 최적화
        • 오버래핑(Overlapping): 문맥 유지를 위해 청크의 앞뒤 청크와 일정 크기만큼 겹치도록 하는 기술
        • Small2Big: 작은 청크로 검색 후 더 큰 문맥을 제공
    • 인덱싱 (Indexing) 전략: 청크를 효율적으로 구성하여 검색 속도와 정확도 증가
      • 주요 방식:
        • 계층적 인덱스: 인덱스를 계층을 만들어 상위 계층에서 먼저 검색하고 하위 계층을 검색, 정확도 및 효율성 개선
        • 그래프 인덱스: 인덱스의 관계를 통해 더 정확한 검색 가능
        • 하이브리드 인덱스: 키워드 검색과 벡터 검색을 결합
    • 업데이트 전략: 원본 데이터 변경 시 DB를 최신 상태로 유지 (예: 증분, 부분, 실시간 업데이트)
  2. 추론 (Inference) - 답변 생성 실시간 처리 단계
    • 쿼리 전처리 (Query Preprocessing): 검색 전, 사용자의 질문을 명확하게 가공
      • 주요 기술:
        • 쿼리 재작성(Query Rewriting):모호한 질문을 명확하게 수정
        • 하위 질문 분해(Sub-queries): 복잡한 질문을 분해
        • 쿼리 라우터(Query Router): 질문 유형에 따라 최적의 검색 경로 결정
    • 검색 후 처리 (Post-retrieval): 검색된 청크를 LLM에 전달하기 전 최적화합니다.
      • 주요 기술:
        • 재순위화(Re-ranking): 관련성 낮은 정보를 필터링하고, 중요한 정보를 앞뒤에 배치
        • 프롬프트 압축: 프롬프트 길이를 줄여 비용을 절감
    • 완성 후 처리 (Post-completion): LLM이 생성한 답변 초안을 최종 검토
      • 주요 기술: 팩트 체크를 통해 환각(Hallucination)을 방지하고, 조직의 정책 준수 여부를 확인합니다.
  3. 평가 (Evaluation) - 시스템 성능 측정 및 개선 단계
    • 피드백 수집: 사용자의 '좋아요/싫어요' 같은 피드백을 수집하여 평가에 활용합니다.
    • 정확도 및 안전성 평가: 답변의 사실 기반 여부를 평가하고, 문제 발생 시 프로세스를 중단시키는 안전 장치(Guardrails)를 마련합니다.
    • 상세 로깅 및 안전한 배포: 문제 원인 분석을 위해 데이터를 상세히 기록하고, A/B 테스트 등을 통해 안정적으로 시스템을 업데이트합니다.
profile
AI 엔지니어 김태종입니다. 추천시스템, 이상탐지, LLM에 관심이 있습니다. 블로그에는 공부한 기술, 논문 혹은 개인적인 경험을 올리고 있습니다.

0개의 댓글