LangChain으로 구현하는 RAG 시스템 정확하고 맥락에 맞는 AI 응답 생성하기

궁금하면 500원·2025년 2월 8일

AIchat AI개발 LLM최적화 chatGPT langChain rag 검색증강생성 문서검색 벡터검색 임베딩 자연어처리 지식베이스 파이썬AI

AI 미생지능

목록 보기

39/68

LangChain을 활용한 RAG 시스템 구축

검색 증강 생성(Retrieval Augmented Generation, RAG)은 대규모 언어 모델(LLM)의 성능을 향상시키는 강력한 기술입니다.

LangChain을 활용하여 RAG 시스템을 구축하면 외부 데이터 소스를 활용해 더 정확하고 맥락에 맞는 응답을 생성할 수 있습니다.

이 글에서는 LangChain으로 RAG 시스템을 구축하는 방법을 단계별로 알아보겠습니다.

RAG의 개념과 중요성

RAG는 언어 모델이 학습 데이터 외의 공개 없는 지식 베이스를 참조하여 응답을 생성하는 프레임워크입니다.

이 방식은 다음과 같은 LLM의 한계를 극복합니다.

잘못된 정보 제공 방지
오래된 정보나 일반적인 정보 대신 최신의 구체적인 정보 제공
신뢰할 수 있는 출처에서 정보 활용
응어 훈련으로 인한 부정확한 응답 방지

RAG는 기업이 내부 지식 베이스나 특정 도메인에 LLM을 적용할 때 모델을 재학습시키지 않고도 효과적으로 활용할 수 있게 해줍니다.

RAG의 작동 원리

RAG 시스템은 다음 네 가지 주요 단계로 작동합니다.

인덱싱(Indexing): 외부 데이터를 벡터 임베딩으로 변환하여 벡터 데이터베이스에 저장
검색(Retrieval): 사용자 쿼리와 관련된 문서를 검색
증강(Augmentation): 검색된 정보를 사용자 쿼리에 추가
생성(Generation): LLM이 증강된 쿼리와 검색된 정보를 바탕으로 응답 생성

LangChain으로 RAG 시스템 구축하기

기본 환경 설정

먼저 필요한 라이브러리를 설치합니다.

pip install langchain langchain_community faiss-cpu sentence-transformers transformers

문서 로딩 및 처리

from langchain_community.document_loaders import PyPDFLoader
from langchain.text_splitter import RecursiveCharacterTextSplitter

# PDF 문서 로드
loader = PyPDFLoader("your_document.pdf")
documents = loader.load()

# 문서 분할
text_splitter = RecursiveCharacterTextSplitter(
    chunk_size=1000,
    chunk_overlap=200
)
splits = text_splitter.split_documents(documents)

임베딩 생성 및 벡터 저장소 구축

from langchain.embeddings import HuggingFaceEmbeddings
from langchain.vectorstores import FAISS

# 임베딩 모델 초기화
embeddings = HuggingFaceEmbeddings()

# FAISS 벡터 저장소 생성
vectorstore = FAISS.from_documents(splits, embeddings)
retriever = vectorstore.as_retriever()

프롬프트 템플릿 및 LLM 체인 구성

from langchain.chat_models import ChatOpenAI
from langchain.prompts import ChatPromptTemplate
from langchain.chains.combine_documents import create_stuff_documents_chain
from langchain.chains import create_retrieval_chain

# 프롬프트 템플릿 정의
prompt_template = """다음 정보를 바탕으로 질문에 답변해주세요:
{context}

질문: {question}
답변: """

prompt = ChatPromptTemplate.from_template(prompt_template)

# LLM 초기화
llm = ChatOpenAI(model="gpt-3.5-turbo")

# 문서 체인 생성
document_chain = create_stuff_documents_chain(llm, prompt)

# 검색 체인 생성
retrieval_chain = create_retrieval_chain(retriever, document_chain)

질의응답 시스템 실행

def ask_question(question):
    response = retrieval_chain.invoke({"question": question})
    return response["answer"]

# 예시 질문
result = ask_question("이 문서의 주요 내용은 무엇인가요?")
print(result)

고급 RAG 구현: Parent Document Retriever

기본 RAG 기법의 한계를 극복하기 위해 Parent Document Retriever 기법을 활용할 수 있습니다.

이 방식은 문서의 맥락을 유지하면서 더 정확한 검색을 가능하게 합니다.

from langchain.retrievers import ParentDocumentRetriever
from langchain.storage import InMemoryStore

# 메모리 스토어 초기화
store = InMemoryStore()

# 부모 및 자식 청크 분할기 정의
parent_splitter = RecursiveCharacterTextSplitter(chunk_size=2000)
child_splitter = RecursiveCharacterTextSplitter(chunk_size=500)

# Parent Document Retriever 설정
retriever = ParentDocumentRetriever(
    vectorstore=vectorstore,
    docstore=store,
    child_splitter=child_splitter,
    parent_splitter=parent_splitter
)

# 문서 추가
retriever.add_documents(documents)

RAG의 실제 활용 사례

RAG는 다양한 산업 분야에서 활용되고 있습니다:

고객 지원 챗봇: FAQ, 고객 이력, 제품 지식 베이스를 통합하여 정확한 응답 제공
콘텐츠 생성 및 요약: 다양한 출처에서 최신 정보를 검색하여 고품질 콘텐츠 생성
시기 탐지 및 위험 평가: 실시간 데이터를 검색하여 더 정확한 이상 탐지
기업 지식 관리: 방대한 조직 데이터를 효율적으로 검색하여 의사결정 지원
코드 생성 및 소프트웨어 개발: 관련 코드 스니펫을 검색하여 개발 프로세스 가속화

고급 RAG 최적화 기법

기본 RAG 시스템을 넘어 성능을 더욱 향상시키는 고급 기법들이 있습니다.

임베딩 최적화

도메인 특화 임베딩 모델 사용
시맨틱 유사성이 아닌 하이브리드 검색 구현 (키워드 + 시맨틱)
군집화 기법으로 임베딩 효율성 향상

검색 전략 개선

Top-K 결과에 다양성 추가 (MMR 알고리즘)
재랭킹 기법으로 초기 검색 결과 개선
쿼리 확장 및 재작성으로 검색 정확도 향상

프롬프트 엔지니어링

검색된 컨텍스트에 적합한 프롬프트 템플릿 설계
검색 결과 중요도에 따른 가중치 부여
CoT(Chain-of-Thought) 프롬프팅 통합

마무리

LangChain을 활용한 RAG 시스템은 언어 모델의 한계를 극복하고 외부 데이터 소스를 활용하여 더 정확하고 맥락에 맞는 응답을 생성할 수 있게 해줍니다.

이 기술은 기업이 내부 지식 베이스나 특정 도메인에 LLM을 효과적으로 적용할 수 있게 하며, 다양한 산업 분야에서 혁신적인 애플리케이션을 구축하는 데 활용되고 있습니다.

궁금하면 500원

꾸준히, 의미있는 사이드 프로젝트 경험과 문제해결 과정을 기록하기 위한 공간입니다.

이전 포스트

LangChain 성능 캐싱부터 비동기 처리까지 최적화 구현하기

다음 포스트