RAG: 검색 기반 AI 생성 기술

김소희·2025년 11월 20일

RAG란 무엇인가

RAG(Retrieval-Augmented Generation)는 검색(Retrieval)과 생성(Generation)을 결합한 AI 활용 방식이다. 외부 지식을 먼저 검색한 후, 그 내용을 바탕으로 LLM이 답변을 생성하는 구조다.

용어를 분해해보면 다음과 같다.

Retrieval: 검색 또는 검색해서 가져오기
Augmented: 보강된, 강화된
Generation: 생성

직역하면 "검색으로 보강된 생성" 정도가 된다.

RAG가 필요한 이유

GPT 같은 LLM은 학습 시점 이후의 정보를 알지 못한다. 2023년이나 2024년에 학습된 모델은 그 이후의 최신 정보를 제공할 수 없다. 또한 회사 내부 문서, PDF, 데이터베이스 같은 사적 데이터도 원래는 접근할 수 없다.

따라서 단순 LLM만 사용하면 다음과 같은 문제가 발생한다.

최신 정보 부족
환각(Hallucination) 현상 발생

RAG를 사용하면 AI가 외부 지식과 연결되어 정확한 답변을 제공할 수 있다.

RAG의 동작 원리

RAG는 다음과 같은 흐름으로 동작한다.

1단계: 질문 입력

사용자가 질문을 입력한다.

예시: "이번 분기 매출을 요약해줘"

2단계: 검색(Retrieval)

벡터 데이터베이스(Chroma, Pinecone, FAISS 등)에서 관련 문서를 검색한다. 예를 들어 사내 데이터베이스에서 Q2 매출 보고서를 찾아온다.

3단계: 생성(Generation)

찾은 문서를 LLM 입력에 추가한다. "매출 보고서 내용을 바탕으로 요약해줘"라는 지시와 함께 LLM이 답변을 생성한다.

4단계: 출력

출력 예시: "2분기 매출은 20% 증가했으며, 주요 원인은 온라인 판매 확대다."

전체 흐름을 정리하면 다음과 같다.

[사용자 질문]
     ↓
[검색(Retrieval): DB/문서에서 관련 자료 찾기]
     ↓
[생성(Generation): LLM이 자료를 읽고 답변 작성]
     ↓
[최종 답변]

실제 활용 예시

검색 없는 GPT

질문: "서울 날씨 어때?"
답변: 학습된 오래된 정보만 말하거나 틀린 답을 제공할 수 있다

RAG 활용 GPT

질문: "서울 날씨 어때?"
과정: 날씨 API에서 오늘 서울 날씨 검색
답변: "오늘 서울은 28도, 맑다"

RAG의 주요 장점

RAG를 활용하면 다음과 같은 이점을 얻을 수 있다.

최신 정보 반영 가능: 실시간으로 업데이트되는 정보를 활용할 수 있다
내부 데이터 활용: 회사 내부 문서, 데이터베이스 등 사적 데이터를 활용할 수 있다
정확성 향상: 실제 데이터를 기반으로 답변하므로 정확도가 높아진다
환각 현상 감소: 근거 없는 답변이나 잘못된 정보 생성이 줄어든다

기술 스택

RAG를 구현하기 위해서는 다음과 같은 기술이 필요하다.

벡터 데이터베이스: Chroma, Pinecone, FAISS, pgvector 등
임베딩 모델: 텍스트를 숫자 벡터로 바꾸는 모델 OpenAI Embeddings, Sentence Transformers 등
LLM: GPT-4, Claude, Llama 등
프레임워크: LangChain, LlamaIndex 등
Retriever (검색기):
벡터 DB에서 관련 문서 검색
Generator (생성기): LLM (예: GPT, Gemini 등)이 답변 작성

정리

RAG는 LLM의 한계를 극복하고 실제 업무 환경에서 활용 가능한 AI 시스템을 구축하는 핵심 기술이다. 검색과 생성을 결합함으로써 최신 정보와 사적 데이터를 활용하면서도 자연스러운 답변을 생성할 수 있다. 기업 내부 문서 검색, 고객 지원 챗봇, 지식 관리 시스템 등 다양한 분야에서 RAG의 활용이 확대되고 있다.