🔨[개발] Langchain이란?

mandu·2025년 10월 15일

[개발]

목록 보기

8/9

1. LangChain이란?

LangChain은 대규모 언어 모델(LLM, Large Language Model) 을 활용한
AI 애플리케이션을 빠르고 효율적으로 구축할 수 있도록 도와주는 오픈소스 프레임워크임.

LLM(GPT, Claude, Gemini 등)은 이미 다양한 지식에 기반해 텍스트를 생성할 수 있지만,
특정 도메인 데이터나 사내 문서처럼 훈련에 포함되지 않은 정보를 활용하기는 어렵다는 한계가 있음.

LangChain은 이런 LLM의 한계를 해결하기 위해,
외부 데이터 소스 연결, 프롬프트 체인 구성, RAG 검색 구조 통합 등을 지원
즉, 단순히 모델을 호출하는 수준을 넘어,
“LLM을 활용한 실제 서비스 개발을 위한 엔진” 역할을 수행

2. LangChain이 중요한 이유

LLM은 일반적인 질문에는 잘 답하지만,
조직 내부 데이터나 최신 정보와 관련된 질문에는 취약함.
예를 들어:

“우리 회사에서 판매 중인 X1000 모델의 단가가 얼마인가요?”

→ GPT는 이 정보를 모름.
하지만 LangChain을 사용하면 사내 DB나 문서에서 이 데이터를 검색해
정확한 답변을 생성할 수 있음

즉, LangChain은

LLM이 기존에 학습하지 않은 외부 데이터 접근을 가능하게 하고,
프롬프트 엔지니어링 및 체인 구성을 통해 모델의 응답 품질을 높이며,
RAG(검색 증강 생성) 같은 최신 워크플로를 간단히 구현할 수 있게 함

🔨[개발] RAG란?

3. LangChain의 장점

항목	설명
LLM 재훈련 불필요	기존 모델을 그대로 사용하며 외부 데이터 연결로 확장 가능
빠른 프로토타이핑	RAG, QA 챗봇, 요약기 등을 빠르게 구현 가능
유연한 구조	체인·에이전트·메모리 등 모듈 조합으로 다양한 워크플로 설계
강력한 커뮤니티	활발한 오픈소스 생태계와 문서, 예시 코드 풍부

4. LangChain의 주요 구성 요소

구성 요소	설명
LLM 인터페이스	GPT, Claude, PaLM 등 다양한 언어 모델과 연결하기 위한 표준화된 API 제공. 모델 교체 시 코드 수정 최소화 가능
프롬프트 템플릿 (PromptTemplate)	일관된 질의 형식을 정의하여 모델 입력을 구조화하고, 재사용 가능한 프롬프트를 생성함
체인 (Chain)	여러 작업 단계를 순차적으로 연결해 하나의 자동화된 응답 파이프라인(workflow)을 구성함
에이전트 (Agent)	모델이 스스로 필요한 도구나 단계를 판단하여 실행 순서를 결정하도록 함
검색 모듈 (Retriever)	외부 데이터(문서, DB, 웹 등)를 임베딩 후, 의미 기반 검색(Semantic Search)으로 컨텍스트를 제공함
메모리 (Memory)	대화 이력이나 과거 정보를 저장·활용하여 문맥을 유지하고 응답의 일관성을 확보함
콜백 (Callback)	체인 실행 중 발생하는 이벤트, 오류, 로그를 모니터링하고 디버깅할 수 있도록 지원함

4.1 LLM 인터페이스

GPT, Claude, PaLM 등 다양한 모델과 연결할 수 있는 표준 API를 제공
→ 모델 교체 시 코드 수정 최소화

from langchain_openai import ChatOpenAI
llm = ChatOpenAI(model="gpt-4o", temperature=0)

4.2 체인(Chain)

LangChain의 중심은 체인(Chain)
체인은 사용자의 입력부터 모델의 출력까지, 하나의 파이프라인(workflow)을 의미

그리고 체인을 이루는 링크(Link)
링크는 체인을 구성하는 하나의 단위 작업(step) 으로,
여러 링크가 순차적으로 연결되어 전체 파이프라인(체인)을 형성

즉,

여러 개의 작업(링크)을 순차적으로 연결한 실행 흐름(체인)

예를 들어, 다음과 같은 단계를 체인으로 묶을 수 있음
1. 사용자 입력 정제 (Input Formatting)
2. LLM에 질의 (Query)
3. 결과 정리 및 출력 (Output Formatting)
4. 번역

LangChain에서는 이 일련의 단계를 chain() 함수로 정의할 수 있음

chain([
  retrieve_data_from_database(),
  send_data_to_language_model(),
  format_output(),
  translate_output_in_target_language()
])

이처럼 여러 링크(Link) 를 연결하여 하나의 체인으로 구성할 수 있음
각 링크는 작은 단위의 작업이며, 순서와 구성을 자유롭게 바꿀 수 있음

4.3 프롬프트 템플릿 (PromptTemplate)

질문 구조를 템플릿으로 정의하여, 일관되고 재사용 가능한 질의 형태를 생성

from langchain.prompts import PromptTemplate

template = PromptTemplate.from_template(
    "너는 HR 도우미야. 사용자 질문: {question}"
)
prompt = template.format(question="연차 규정 알려줘")

4.4 에이전트 (Agent)

에이전트는 단순히 답변을 생성하는 것을 넘어,
스스로 어떤 도구를 사용해야 하는지 판단하고 그 과정을 수행하는 것

즉, 정해진 순서대로 실행하는 체인(Chain) 과 달리,
에이전트는 상황에 따라 어떤 단계와 도구를 쓸지 스스로 판단

# pip install langchain langchain-openai

from langchain.agents import initialize_agent, load_tools
from langchain_openai import ChatOpenAI

# 1) 사용할 LLM 정의
llm = ChatOpenAI(model="gpt-3.5-turbo", temperature=0)

# 2) 사용할 도구(tool) 불러오기
# LangChain은 'tools'라는 표준 모듈에 다양한 기능이 등록되어 있음
tools = load_tools(["serpapi", "llm-math"], llm=llm)
# - serpapi: 웹 검색용 API
# - llm-math: 수학 계산기 기능

# 3) 에이전트 초기화
agent = initialize_agent(
    tools=tools,
    llm=llm,
    agent_type="zero-shot-react-description",  # ReAct 패턴 기반
    verbose=True
)

# 4) 실행 예시
query = "대한민국 수도의 위도에 5를 더하면 얼마야?"
agent.run(query)

# LLM이 직접 “검색 → 계산 → 답변 생성” 과정 전체를 스스로 판단하고 실행

4.5 검색 모듈 (Retrieval)

RAG(Retrieval-Augmented Generation) 구현의 핵심 구성요소
문서, PDF, DB, 웹 등 다양한 외부 데이터를 벡터 임베딩으로 저장하고,
사용자 질의와 의미적으로 유사한 데이터를 검색

# ✅ 0. 패키지 설치
# pip install langchain langchain-openai faiss-cpu

# ✅ 1. 예시 문서 정의
docs = [
    "연차는 입사 월 기준으로 발생하며, 최대 25일까지 누적 가능함.",
    "경조사 휴가 규정: 결혼 시 5일, 부모상 7일, 자녀 출산 3일 부여됨.",
    "출장비는 사전 승인 후 사용 가능하며, 영수증 제출이 필수임."
]

# ✅ 2. 문서를 벡터로 변환 (Embedding)
from langchain_openai import OpenAIEmbeddings
from langchain_community.vectorstores import FAISS

embedding = OpenAIEmbeddings()          # OpenAI의 임베딩 모델 사용
vector_db = FAISS.from_texts(docs, embedding)  # 문서 임베딩 후 벡터DB(Faiss)에 저장

# ✅ 3. 검색기 (Retriever) 구성
retriever = vector_db.as_retriever(search_kwargs={"k": 2})  # 유사 문서 2개 반환 설정

# ✅ 4. 예시 질의 수행
query = "결혼하면 며칠 휴가임?"
similar_docs = retriever.get_relevant_documents(query)

# ✅ 5. 결과 출력
print("🧾 [질문]", query)
for i, doc in enumerate(similar_docs, 1):
    print(f"{i}. {doc.page_content}")

4.6 메모리 (Memory)

대화형 애플리케이션에서는 이전 대화 맥락이 필요함
LangChain의 메모리 모듈은 이러한 대화 이력 유지 및 참조를 지원함

최근 대화만 기억하는 단순 메모리
전체 대화 중 핵심만 추출해 기억하는 요약 메모리

from langchain.memory import ConversationBufferMemory
memory = ConversationBufferMemory()

4.7 콜백 (Callback)

LangChain 내부 실행 과정(예: 체인 호출, 에러, 응답 시간 등)을
로깅하고 모니터링하는 이벤트 훅 시스템.

from langchain.callbacks import StdOutCallbackHandler
handler = StdOutCallbackHandler()

5. 모든 구성 요소가 담긴 Langchain 사용 예시

# ✅ 패키지 설치
# pip install langchain langchain-openai faiss-cpu tiktoken

# 1️⃣ LLM 인터페이스
from langchain_openai import ChatOpenAI
llm = ChatOpenAI(model="gpt-3.5-turbo", temperature=0)

# 2️⃣ 프롬프트 템플릿
from langchain.prompts import PromptTemplate
template = PromptTemplate.from_template(
    "너는 HR 도우미야. 아래 정보를 참고해서 사용자의 질문에 답변해줘.\n\n"
    "질문: {question}\n"
    "참고 정보: {context}\n\n"
    "답변:"
)

# 3️⃣ 문서 → 벡터DB 구성 (Retrieval)
from langchain_openai import OpenAIEmbeddings
from langchain_community.vectorstores import FAISS

docs = [
    "연차는 입사 월 기준으로 발생하며 최대 25일까지 누적 가능함.",
    "경조사 휴가 규정: 결혼 시 5일, 부모상 7일, 자녀 출산 3일 부여됨.",
    "출장비는 사전 승인 후 사용 가능하며, 영수증 제출이 필수임."
]

embedding = OpenAIEmbeddings()
vdb = FAISS.from_texts(docs, embedding)
retriever = vdb.as_retriever(search_kwargs={"k": 2})

# 4️⃣ 메모리 (이전 대화 유지)
from langchain.memory import ConversationBufferMemory
memory = ConversationBufferMemory(memory_key="chat_history", return_messages=True)

# 5️⃣ 콜백 (실행 로그 출력)
from langchain.callbacks import StdOutCallbackHandler
handler = StdOutCallbackHandler()

# 6️⃣ 체인 구성 (검색 + 프롬프트 + LLM)
from langchain.chains import RetrievalQA
qa_chain = RetrievalQA.from_chain_type(
    llm=llm,
    retriever=retriever,
    chain_type="stuff",
    return_source_documents=True,
    verbose=True
)

# 7️⃣ 에이전트 구성 (검색기 + 계산기 등 도구 조합)
from langchain.agents import initialize_agent, load_tools
tools = load_tools(["llm-math"], llm=llm)
agent = initialize_agent(
    tools=tools + [{"name": "retriever", "description": "회사 문서 검색", "func": qa_chain.run}],
    llm=llm,
    agent_type="zero-shot-react-description",
    verbose=True,
    memory=memory,
    handle_parsing_errors=True
)

# 8️⃣ 예시 실행
query1 = "결혼하면 휴가 며칠 받을 수 있어?"
response1 = agent.run(query1, callbacks=[handler])

query2 = "이전 대화에서 말한 규정 기준으로 출장비 규정도 알려줘."
response2 = agent.run(query2, callbacks=[handler])

print("\n💬 [1차 답변]", response1)
print("💬 [2차 답변]", response2)