🧭 LangGraph 완전 정복 ⑤ — ReAct 패턴과 LangGraph 에이전트화

okorion·2025년 10월 4일

🧩 LangChain & LangGraph — LLM 설계의 완성

목록 보기

8/11

“Reason → Act → Observe → Repeat”
LLM이 스스로 생각하고 행동하는 자율형 그래프의 탄생.

🤖 1. ReAct 패턴이란?

ReAct는 “Reasoning + Acting”의 합성어로, LLM이 사고(Reason) → 행동(Act) → 관찰(Observe) → 재사고(Reflect) 의 순환을 반복하며 스스로 문제를 해결하도록 설계된 구조입니다.
LangChain의 Agent도 이 패턴을 기반으로 하죠.
LangGraph에서는 이 과정을 명시적 그래프 흐름으로 표현할 수 있습니다.

🧩 2. ReAct 패턴의 기본 구조

LLM의 반복 루프를 그래프로 시각화하면 다음과 같습니다.

이 구조를 LangGraph로 구현하면, LLM이 Tool을 사용하고 결과를 스스로 평가하여 다시 시도하는 자율형 그래프가 만들어집니다.

⚙️ 3. 핵심 구성 요소

구성 요소	설명	예시
ReasonNode	LLM이 문제를 분석하고, 어떤 도구를 쓸지 판단	“현재 날씨를 알려면 `get_weather`를 써야겠다.”
ToolNode	LLM이 선택한 도구를 실행	`get_weather("Seoul")`
ObserveNode	Tool 결과를 검토하고 판단	“결과가 이상하면 다시 시도.”
MemorySaver	상태 저장 및 루프 추적	이전 reasoning 및 tool 결과 누적

🧠 4. ReAct 그래프 구현 예시

아래는 “질문 → 사고 → 행동 → 관찰 → 반복”을 구현한 최소 예시입니다.

from langgraph.graph import StateGraph
from langchain_openai import ChatOpenAI

# 상태 정의
class AgentState:
    question: str
    action: str
    observation: str
    retry: int = 0

# Reason 노드
def reason(state: AgentState):
    llm = ChatOpenAI(model="gpt-4o-mini")
    prompt = f"Q: {state.question}\n어떤 행동을 해야 답을 찾을 수 있을까?"
    res = llm.invoke(prompt)
    state.action = res.content.strip()
    print(f"[Reason] 결정된 행동: {state.action}")
    return state

# Act 노드
def act(state: AgentState):
    if "날씨" in state.action:
        state.observation = "서울의 날씨는 맑음 ☀️"
    else:
        state.observation = "적절한 도구를 찾지 못함"
    print(f"[Act] 관찰 결과: {state.observation}")
    return state

# Observe 노드
def observe(state: AgentState):
    if "맑음" in state.observation or state.retry >= 1:
        print("[Observe] 결과 만족. 종료합니다.")
        return "finish"
    print("[Observe] 결과 불만족. 다시 Reason 단계로.")
    state.retry += 1
    return "reason"

# 그래프 구성
graph = StateGraph(AgentState)
graph.add_node("reason", reason)
graph.add_node("act", act)
graph.add_node("observe", observe)

graph.add_edge("reason", "act")
graph.add_edge("act", "observe")
graph.add_conditional_edges("observe", observe)

graph.set_entry_point("reason")
graph.set_finish_point("observe")

app = graph.compile()
app.invoke({"question": "서울의 날씨 알려줘"})

📤 실행 예시:

[Reason] 결정된 행동: 날씨 API를 사용해야 합니다.
[Act] 관찰 결과: 서울의 날씨는 맑음 ☀️
[Observe] 결과 만족. 종료합니다.

LLM이 스스로 “무엇을 해야 하는지” 판단하고, 행동 결과를 관찰하여 다음 단계를 결정하는 ReAct 루프가 만들어졌습니다.

🪄 5. MemorySaver로 상태 유지

MemorySaver를 추가하면, 루프가 돌아도 이전 Reason/Act/Observe 결과를 모두 기억합니다.

from langgraph.checkpoint.memory import MemorySaver

memory = MemorySaver()
app = graph.compile(checkpointer=memory)

이제 각 루프마다 상태 변화가 축적되어, “왜 이런 결정을 내렸는가”를 나중에 추적할 수 있습니다. (LLM의 reasoning trace 분석에도 매우 유용)

🧱 6. LangGraph의 ReAct 구현 방식 요약

구성 요소	LangGraph 표현	의미
Reason	Node (LLM 호출)	사고 단계
Act	ToolNode	행동 단계
Observe	Conditional Edge	피드백 / 루프 제어
MemorySaver	Checkpoint	상태 지속
Loop	Edge 순환	ReAct 루프 구현

LangChain에서는 “자동”으로 돌아가던 루프를 LangGraph에서는 명시적으로 코드로 제어할 수 있습니다.

⚡️ 7. 응용 예시: 다단계 추론 에이전트

예를 들어, “서울의 날씨와 현재 환율을 함께 알려줘” 같은 요청은 ReAct 그래프를 다음과 같이 확장할 수 있습니다.

각 ToolNode는 병렬 실행 가능하며, LLM은 상황에 따라 어떤 Tool을 호출할지 결정할 수 있습니다. (이를 위해 ④편에서 배운 ToolCondition 구조가 그대로 사용됩니다.)

🧭 8. 다음 회차 예고

👉 6편: 그래프 기반 RAG (검색+생성 시스템)
ReAct 구조를 확장하여 “질문 → 검색 → 생성 → 평가 → 수정”으로 이어지는
Adaptive / Self / Corrective RAG 그래프를 설계합니다.

🎓 9. 더 깊이 배우기 위한 고급 확장 학습 가이드

주제	학습 이유	추천 학습 방향
Cognitive Architecture	ReAct의 근본 원리 (ACT-R, Soar 등) 이해	인지 모델 기반 LLM 루프 설계
LangGraph MemorySaver Internals	상태 체크포인트의 구조와 로깅 이해	`MemorySaver` + `graph.get_state()`
LLM Reasoning Trace 분석	사고 과정 시각화 및 평가	Reasoning log / reflection system
Multi-Tool Planning	여러 Tool 중 선택적 호출 설계	PolicyNode / ToolCondition 고급 패턴
Self-Reflective Agent	LLM 스스로 reasoning 평가	Reflection node + critic model
LangGraph + LangServe	ReAct 에이전트를 API 서비스화	REST + StreamLog 통합

📚 핵심 요약

ReAct는 “Reason → Act → Observe”의 루프 구조로 LLM의 자율성을 구현한다.

LangGraph에서는 이 루프를 명시적 그래프로 표현하고,
MemorySaver로 reasoning trace를 관리한다.

이 구조를 기반으로 RAG, 평가 루프, 자율형 에이전트 등으로 확장할 수 있다.

💬 이제 우리는 “명령받는 LLM”이 아닌, “스스로 사고하는 시스템”을 다룰 수 있다.