이 챕터의 흐름
단순히 "AI가 무엇인지"를 넘어서, 이제 "AI를 어떻게 일하게 할 것인가"를 다룬다. Agentic Workflow는 AI가 단발적으로 답변을 생성하는 것이 아니라, 목표를 향해 스스로 계획하고 실행하고 되돌아보는 순환형 작업 구조다. 이 챕터에서는 그 설계 원칙(Goal → Plan → Execute → Reflect)과 다중 에이전트 협업 구조, 그리고 RAG의 에이전트화(Agentic RAG)까지 다룬다.
Traditional Workflow (전통적 방식)
AI Agentic Workflow (에이전틱 방식)
핵심 성능 데이터 (Andrew Ng, deeplearning.ai)
- GPT-3.5 (zero-shot): 48.1% 정확도
- GPT-4 (zero-shot): 67.0% 정확도
- GPT-3.5 + Agentic Workflow: 95.1% 정확도
더 강력한 모델로 업그레이드하는 것보다, Agentic Workflow를 적용하는 것이 더 큰 성능 향상을 가져올 수 있다. 이는 "강력한 모델 + 탄탄한 전략 = 우수한 성능"이라는 공식을 증명한다.
1. Planning (계획 수립)
2. Reflection (자기 피드백)
3. Collaboration (다중 에이전트 협업)
Agent는 사고 구조를 설계하는 것에서 시작한다.
AI Agentic Workflow 설계는 Strategic Layer와 Operational Layer로 구분된다.

Goal은 "무엇을 할지"가 아니라, "무엇이 달성되면 끝인지"를 업무 관점에서 정의하는 단계다.
Desired Outcome (업무 결과 정의)
좋은 Goal 예시:
Success Criteria (측정 가능한 기준 정의)
성공 기준은 "좋은 답변 같은 정성 표현"이 아니라, 측정 가능한 기준으로 정의해야 한다.
| 구분 | 항목 | 내용 |
|---|---|---|
| 결과 품질 기준 (Quality) | 근거성 | 주장마다 근거가 있는가? (출처) |
| 완결성 | 필수 항목을 빠짐없이 포함했는가? | |
| 일관성 | 내부 모순이 없는가? | |
| 업무적 제약 조건 (Constraints) | Target Actor | 톤, 매너, 답변 길이 등 |
| Compliance | 내부정보 노출 금지, 법적 제한 등 | |
| Scope Boundaries | 포함, 제외 범위 | |
| Formatting | JSON, 템플릿, 표 등 | |
| 서비스 기준 (Operational) | Cost | 호출 횟수, Latency 등 |
| Error Handling | 근거 없을 때 응답 규칙 등 | |
| Consistency | 같은/유사 입력에 일관된 품질 수준 유지 | |
| Stability | 반복 실행 시 품질 변동 허용 범위 |
Plan 단계는 다시 세 가지 하위 설계로 나뉜다: Task Decomposition, Control Strategy, Collaboration Structure.
Task Decomposition은 일을 나누는 단계가 아니라, Goal을 달성하기 위한 실행 단위를 설계하는 단계다. 분해된 Subtask는 작업 중심이 아니라 Outcome 중심으로 분해되어야 한다.
Task Decomposition 고려사항:
예시 (Goal: 정책 근거 인용 + 고객 재문의율 감소)

Task Decomposition은 Plan의 뼈대를 구성하는 단계다.
Control Strategy는 "몇 번 반복할 것인가"를 정하는 것이 아니라, 언제 진행하고, 언제 되돌아가고, 언제 멈출지를 설계하는 단계다.
Linear Flow (선형 흐름)
Loop Strategy (반복 제어)
Conditional Branch (조건 분기)
Retry & Termination Policy (종료 정책)
핵심: Task가 구조라면, Control Strategy는 의사결정 로직이다 (특히, 실패를 어떻게 처리할 것인가).
예시 (Control Strategy 적용):

여러 에이전트가 협업할 때 누가 결정권을 가지는지를 설계하는 단계다.
A. Centralized Structure (중앙화 구조)
B. Distributed Structure (분산 구조)
C. Cross-Validation Structure (교차 검증 구조)
D. Hybrid Structure (혼합 구조)
💡 Collaboration Structure 심화: 각 구조의 비교
구조를 선택할 때 핵심 기준은 두 가지다: 의사결정 권한의 집중/분산과 품질 vs 효율성의 트레이드오프.
구조 의사결정 비용 품질 제어 확장성 Centralized Supervisor 집중 중간 높음 낮음 (병목) Distributed 각 Agent 분산 낮음 보통 높음 Cross-Validation Judge 집중 높음 매우 높음 낮음 Hybrid 계층적 분배 높음 높음 중간 실제 프로덕션 시스템은 대부분 Hybrid 구조를 채택하며, 중요도가 높은 경로에만 Cross-Validation을 적용하는 방식으로 비용을 최적화한다.
Execute 단계는 Plan에서 설계된 내용을 실제로 수행하는 단계다.
Reflection은 AI가 자기 응답을 되돌아보고 더 나은 답을 만드는 과정이다. 루프 자체도 자동화하여 사람의 반복 개입 없이도 품질을 향상시킬 수 있다.
역할 분담:
Reflection의 3가지 유형:
1. Self-Reflection
2. Tool-based Reflection
3. External Judge Reflection
여러 에이전트가 협력하여 복잡한 작업을 수행하는 구조. 각각의 에이전트가 서로 다른 관점과 기능을 제공하여, 단일 에이전트가 할 수 없는 복잡한 과업을 분할/협력하여 처리한다.
1. Parallel Collaboration (병렬 협업)
2. Sequential Collaboration (순차 협업)
3. Negotiation & Debates (토론 기반 협업)
💡 ChatDev: 멀티 에이전트 소프트웨어 개발 실험
ChatDev는 멀티 에이전트 협업으로 자동화된 소프트웨어 개발을 시도한 프로젝트다. 기획 → 설계 → 구현 → 테스트 → 배포까지 각 단계를 전담하는 에이전트들이 역할을 분담하고 의사소통하는 구조를 실험했다.
이는 AI Agent 협업의 가능성을 보여주는 초기 연구로, 현재 Superpowers, Cursor.AI 등 실제 코딩 에이전트 도구들의 이론적 배경이 되었다.
💡 Superpowers: AI Coding Agent의 설계 원칙
Superpowers는 AI Coding Agent가 코드를 작성하는 방식을 근본적으로 바꾼 오픈소스 소프트웨어 개발 프레임워크다. 그 워크플로우가 AI Agentic Workflow 설계의 교과서적 예시다:
- Brainstorming: 코드 짜기 전 "무엇을 만들 것인가?"를 먼저 질문하여 아이디어를 구체화. 사용자 검증을 거쳐 명확한 설계 문서를 먼저 작성해야만 다음 단계로 넘어감.
- Git Worktrees: 설계가 승인되면 메인 브랜치를 안전하게 보호하기 위해 완전히 격리된 개발 환경 구축.
- Planning: 전체 프로젝트를 2~5분 안에 끝낼 수 있는 아주 작은 단위의 작업으로 정의. 각 작업에는 정확한 파일 경로, 실행 코드, 검증 단계가 포함됨.
- Subagent-Driven Dev: 쪼개진 단위 작업은 새롭게 정의된 Sub-agent들에게 배분. Context가 꼬이거나 과부하가 걸리는 것을 방지.
- Test-Driven Dev (TDD): 엄격한 Red-Green-Refactor TDD 강제. 반드시 실패하는 테스트 코드를 먼저 작성하고, 이를 통과하는 최소한의 코드만 작성하도록 통제.
- Code Review: 초기 설계를 잘 따랐는지 1차 검증하고, 코드 품질에 대하여 2차 리뷰 진행. 치명적인 이슈가 발견되면 다음 단계 진행이 차단됨.
- Finishing: 모든 작업과 테스트가 성공적으로 완료되면 Pull Request 생성, 병합, 작업공간 정리.
RAG(Retrieval-Augmented Generation)는 LLM이 외부 문서나 데이터베이스에서 관련 정보를 검색하여 답변을 생성하는 방식이다. 전통적인 RAG는 단순히 "검색 → 답변 생성"의 단방향 프로세스다.
Agentic RAG는 AI Agent의 특성(Planning, Reflection, Collaboration)을 RAG에 적용한 개념이다.
Agentic RAG = [Planning + Reflection + Collaboration] + RAG
전통적 RAG와의 비교:
| 구분 | 전통적 RAG | Agentic RAG |
|---|---|---|
| 프로세스 | 검색 → 답변 생성 (단방향) | 계획 → 검색 → 평가 → 재검색 → 생성 → 검토 (순환) |
| 정보 검색 방식 | 사전에 인덱싱된 문서(Vector DB) 조회에 국한 | 웹검색, API 호출, 코드 실행, 계산기 등 다양한 도구를 목적에 맞게 선택 |
| 응답 생성 과정 | 단순히 검색된 정보를 바탕으로 응답 생성 | 검색된 정보를 요약, 통합, 분석 후 응답 생성 |
| 복잡한 요청 처리 | 제한적인 복잡성 처리 | 다단계 요청을 처리하며, 불확실성 해결하도록 반복 처리 |
| 실시간성 | 닫힌 지식 (Closed Domain) | 열린 지식 (Open Domain) |
| Cost | 빠르고 저렴함 (Single Call) | 상대적으로 느리고 비쌈 (Multiple Calls & Loops) |
| 적용 사례 | Simple Q&A, FAQ | In-depth Q&A, 검색 기반 보고서 생성 |
Strategy 비교:
| 전략 | 전통적 RAG | Agentic RAG |
|---|---|---|
| Planning | 검색 → 답변 생성 | AI가 목적에 맞게 검색 전략을 스스로 설계. 어떤 문서를 찾을지, 어떤 순서로 검색, 요약, 생성할지 결정 |
| Reflection | 검색된 정보 그대로 사용 (별도 평가 없음) | AI가 생성된 응답에 대해 스스로 검토. 검색 내용이 불충분하면 다시 검색→수정 루프를 수행 |
| Collaboration | Agent 아닌 정보 검색 프로세스 (협업 없음) | 여러 역할을 가진 Agent들이 협업 (검색 에이전트, 요약 에이전트, 응답 검토 에이전트 등 역할 분담) |
Agentic RAG의 전체 흐름:

각 단계의 의미:
더 강한 모델보다 잘 설계된 워크플로우가 성능을 좌우한다. Agentic Workflow의 설계는 "무엇이 달성되면 끝인지"를 측정 가능한 기준으로 정의하는 Goal에서 시작하고, Task Decomposition · Control Strategy · Collaboration Structure로 구성된 Plan이 그 뼈대를 잡는다. 종료 조건 없는 루프는 Agent를 멈추지 않게 만드는 가장 흔한 함정이므로, 반복 횟수와 실패 시 처리 방식은 반드시 명확히 정해두어야 한다.