Advanced RAG 개념

TaeJong Kim·2025년 9월 26일

출처: https://learn.microsoft.com/en-us/azure/developer/ai/advanced-retrieval-augmented-generation

Advanced RAG 파이프라인 요약

Advanced RAG는 기본 RAG(Naive RAG)의 한계를 극복하기 위해, 전체 과정을 수집(Ingestion), 추론(Inference), 평가(Evaluation)의 3단계로 나누어 각 부분을 체계적으로 최적화한 모델입니다.

수집 (Ingestion) - DB 구축 단계
- 콘텐츠 전처리: 데이터 형식을 통일하고, 불필요한 정보를 제거하며, 표·이미지 등 복합 콘텐츠와 메타데이터를 추출
- 청킹 (Chunking) 전략: 문서를 의미 단위(청크)로 분할
  - 핵심 기술:
    - 청크 크기 최적화
    - 오버래핑(Overlapping): 문맥 유지를 위해 청크의 앞뒤 청크와 일정 크기만큼 겹치도록 하는 기술
    - Small2Big: 작은 청크로 검색 후 더 큰 문맥을 제공
- 인덱싱 (Indexing) 전략: 청크를 효율적으로 구성하여 검색 속도와 정확도 증가
  - 주요 방식:
    - 계층적 인덱스: 인덱스를 계층을 만들어 상위 계층에서 먼저 검색하고 하위 계층을 검색, 정확도 및 효율성 개선
    - 그래프 인덱스: 인덱스의 관계를 통해 더 정확한 검색 가능
    - 하이브리드 인덱스: 키워드 검색과 벡터 검색을 결합
- 업데이트 전략: 원본 데이터 변경 시 DB를 최신 상태로 유지 (예: 증분, 부분, 실시간 업데이트)
추론 (Inference) - 답변 생성 실시간 처리 단계
- 쿼리 전처리 (Query Preprocessing): 검색 전, 사용자의 질문을 명확하게 가공
  - 주요 기술:
    - 쿼리 재작성(Query Rewriting):모호한 질문을 명확하게 수정
    - 하위 질문 분해(Sub-queries): 복잡한 질문을 분해
    - 쿼리 라우터(Query Router): 질문 유형에 따라 최적의 검색 경로 결정
- 검색 후 처리 (Post-retrieval): 검색된 청크를 LLM에 전달하기 전 최적화합니다.
  - 주요 기술:
    - 재순위화(Re-ranking): 관련성 낮은 정보를 필터링하고, 중요한 정보를 앞뒤에 배치
    - 프롬프트 압축: 프롬프트 길이를 줄여 비용을 절감
- 완성 후 처리 (Post-completion): LLM이 생성한 답변 초안을 최종 검토
  - 주요 기술: 팩트 체크를 통해 환각(Hallucination)을 방지하고, 조직의 정책 준수 여부를 확인합니다.
평가 (Evaluation) - 시스템 성능 측정 및 개선 단계
- 피드백 수집: 사용자의 '좋아요/싫어요' 같은 피드백을 수집하여 평가에 활용합니다.
- 정확도 및 안전성 평가: 답변의 사실 기반 여부를 평가하고, 문제 발생 시 프로세스를 중단시키는 안전 장치(Guardrails)를 마련합니다.
- 상세 로깅 및 안전한 배포: 문제 원인 분석을 위해 데이터를 상세히 기록하고, A/B 테스트 등을 통해 안정적으로 시스템을 업데이트합니다.

TaeJong Kim

AI 엔지니어 김태종입니다. 추천시스템, 이상탐지, LLM에 관심이 있습니다. 블로그에는 공부한 기술, 논문 혹은 개인적인 경험을 올리고 있습니다.

Advanced RAG 개념

Claude, Notion MCP 연결하기

GraphRAG란 무엇인가?

0개의 댓글