Claude 블로그 되짚어보기 #40 — Claude Agent SDK, 코딩 도구가 일반 에이전트 인프라로 진화한 날 (2025)

panicdev·2026년 4월 26일

AI AgentSDK Anthropic Claude LLM agent claudecode 블로그리뷰

원문 정보

제목: Building agents with the Claude Agent SDK
링크: claude.com/blog/building-agents-with-the-claude-agent-sdk
발행: 2025년 9월 29일 (Claude Sonnet 4.5 출시 동시)
카테고리: Engineering / Product announcements

글의 요지

Claude Code SDK가 Claude Agent SDK로 리브랜딩됐다. 이름 변경의 이유는 단순하다 — Claude Code의 내부 인프라(harness)가 이미 Anthropic 사내에서 딥 리서치, 비디오 제작, 노트 관리 등 거의 모든 메이저 에이전트 루프를 구동하고 있기 때문. 코딩 도구가 일반 에이전트 인프라로 진화한 것이다.

핵심 메시지

"Claude Code has become far more than a coding tool. At Anthropic, we've been using it for deep research, video creation, and note-taking, among countless other non-coding applications. In fact, it has begun to power almost all of our major agent loops."

이 한 줄이 SDK 리브랜딩의 핵심. Claude Code SDK = 코딩용 → Claude Agent SDK = 범용 에이전트용.

패키지 정보

NPM: @anthropic-ai/claude-agent-sdk (TypeScript/JavaScript)
Python: claude-agent-sdk
CLI: Claude Code 자체가 SDK 위에서 작동하는 reference implementation

Three-Phase Agentic Loop

본문이 명시한 에이전트의 핵심 작동 패턴:

Gather Context → Take Action → Verify Work → (Repeat)

Gather Context (컨텍스트 수집)
- 파일 읽기, 검색, 도구 호출로 현재 상태 파악
- 사용자 요청 이해
Take Action (행동)
- 도구 호출 — Bash, file edit, API 등
- 실제 변경 수행
Verify Work (검증)
- 결과 확인 — 테스트 실행, 출력 검사
- 의도대로 됐는지 평가
Repeat — 끝나지 않았으면 다시 1로

주요 빌딩 블록

Tools (1순위)

컨텍스트 윈도우의 가장 두드러진 자리 — Claude가 가장 자주 고려할 행동
신중한 도구 설계 필수: 자주 쓸 primary actions만 도구로
예 (이메일 에이전트): fetchInbox, searchEmails 같은 빈도 높은 작업

Bash (범용 도구)

컴퓨터 자원에 대한 유연한 접근
도구가 미리 정의되지 않은 작업 처리 가능
예: 이메일 첨부 처리

MCP Integrations

외부 도구·서비스 연결
Slack, GitHub, Notion 등 통합

Subagents

병렬화 및 검증 계층
메인 에이전트 → 서브 에이전트 위임 → 결과 통합

Anthropic Client SDK vs Agent SDK

본문에서 명시한 차이:

# Client SDK: 사용자가 도구 루프를 직접 구현
response = client.messages.create(...)
while response.stop_reason == "tool_use":
    result = your_tool_executor(response.tool_use)
    response = client.messages.create(tool_result=result, **params)

# Agent SDK: Claude가 도구를 자동 처리
async for message in query(prompt="Fix the bug in auth.py"):
    print(message)

즉:

Client SDK: 저수준 — API 직접 사용, 도구 루프 본인이
Agent SDK: 고수준 — Claude가 도구 실행, 사용자는 결과만 받음

동시 출시 이벤트들

Sonnet 4.5 + Agent SDK 발표일에 함께 나온 것들:

Claude Sonnet 4.5: 30+ 시간 자율 코딩 (claude-sonnet-4-5)
Claude Code 체크포인트: 진행 저장, 즉시 롤백
VS Code 네이티브 확장
Context Editing + Memory Tool (#39 글 참고)
"Imagine with Claude" research preview
Code Execution + File Creation 모든 유료 플랜 GA

2026년에 다시 읽으며 — 내가 본 것

1. "코드 → 일반"으로의 패러다임 확장

이 리브랜딩이 가지는 진짜 의미는 단순한 마케팅이 아니다. 코딩 에이전트의 인프라가 그 자체로 일반 에이전트 인프라라는 통찰이다.

이 통찰의 함의:

기존 가정: 코딩 에이전트와 일반 에이전트는 다른 카테고리. 각각 별도 인프라 필요.

Anthropic의 발견: 코딩 에이전트의 빌딩 블록 — 도구 호출, 파일 시스템, 셸, 검증 루프 — 이 사실은 모든 디지털 노동의 기본 단위.

왜 그런가? 디지털 작업의 본질이:

상태 읽기 (코드 = 파일 읽기 / 리서치 = 문서 읽기 / 노트 = 데이터베이스 쿼리)
상태 변경 (코드 = 파일 편집 / 리서치 = 보고서 작성 / 노트 = DB 업데이트)
결과 검증 (코드 = 테스트 / 리서치 = 인용 확인 / 노트 = 데이터 일관성)

→ 같은 패턴이다. 컴퓨터에서 일하는 모든 작업은 결국 file I/O + tool execution + verification.

이 추상화가 정확하다면, 코드 에이전트의 인프라가 자동으로 일반 에이전트 인프라가 된다. Anthropic은 이를 사내 도그푸딩으로 검증(딥 리서치, 비디오, 노트)했고, 그 후 SDK로 외부에 공개했다.

2. "Imagine with Claude"가 보여주는 미래

같은 날 출시된 "Imagine with Claude" research preview가 흥미롭다. 본문 인용:

"Claude generates software on the fly. No functionality is predetermined; no code is prewritten. What you see is Claude creating in real time, responding and adapting to your requests as you interact."

번역: "Claude가 실시간으로 소프트웨어를 생성한다. 미리 정해진 기능 없음, 미리 작성된 코드 없음. 사용자 요청에 맞춰 Claude가 실시간으로 만들고 적응한다."

이게 보여주는 미래의 비전:

고정된 앱 → 상황별 생성 앱
사용자가 "todo 리스트 만들어줘" → Claude가 즉석에서 todo 앱 생성
다음에 "이번 건 칸반보드로" → 같은 데이터 위에 칸반 UI 생성
앱 = 대화의 부산물

이 비전이 2026년 현재 더 발전했다. Claude Cowork가 데스크톱에서 작업하면서 필요한 도구를 즉석에서 만들고, Claude in Chrome이 페이지 위에 즉석 UI를 띄운다. "AI가 앱을 만든다" 가 아니라 "앱이라는 개념이 사라진다".

3. "Three-Phase Loop"의 인지과학적 토대

Gather Context → Take Action → Verify Work 패턴이 인공적인 게 아니다. 이건 인간 인지의 OODA 루프 와 거의 동일하다.

OODA: Observe → Orient → Decide → Act (군사·인지과학에서 의사결정 루프)
Anthropic: Gather Context → Take Action → Verify Work (에이전트 루프)

차이:

OODA의 Decide ≈ Claude가 도구 선택할 때 자동
OODA의 Observe + Orient ≈ Gather Context
OODA의 Act ≈ Take Action
Anthropic이 추가한 것 ≈ Verify Work (검증 단계)

검증 단계의 추가가 중요하다. 인간은 자기 행동의 결과를 잘 검증 안 한다(인지 편향). LLM은 더 나쁘다(환각). 명시적 검증 단계가 신뢰성 향상의 결정적 메커니즘.

이 패턴이 2026년의 모든 진지한 에이전트의 표준이 됐다 — Cowork agent teams, Claude Code의 verification subagents, Skills 시스템 모두 이 루프를 따른다.

4. "Subagents = Verification Hierarchy"의 발견

본문이 강조하는 패턴 — subagents for verification.

기존 패턴:

한 에이전트가 모든 일 수행
자기 결과를 자기가 평가

문제:

확증 편향: 자기가 만든 답을 옳다고 보기 쉬움
컨텍스트 오염: 같은 컨텍스트 안에서 객관적 평가 어려움

Subagent 패턴:

메인 에이전트가 작업 수행
새로운 컨텍스트의 subagent가 결과 검증
깨끗한 시각으로 평가

이 패턴이 "Writer/Reviewer pattern" 이라는 이름으로 표준화됐다 — Claude Code 베스트 프랙티스에 명시:

"A fresh context improves code review since Claude won't be biased toward code it just wrote."

번역: "새 컨텍스트가 코드 리뷰를 개선한다. Claude가 방금 자기가 쓴 코드에 편향되지 않기 때문이다."

이 발견이 multi-agent 아키텍처의 근거다. 단순 병렬화가 아니라 서로 다른 시각으로 같은 문제 검토 하는 게 핵심.

5. "Anthropic이 자신의 추상화를 외부에 공개한다"

이 발표의 메타 의미는 Anthropic이 자기 인프라를 외부 빌더에게 푸는 패턴이다.

Anthropic의 일관된 패턴:

2024년 11월 MCP: 자기 도구 통합 표준 → 오픈소스 공개
2025년 9월 Agent SDK (이 글): 자기 에이전트 인프라 → 외부 공개
2025년 10월 Skills: 자기 도메인 패키징 → 오픈 표준 (12월 18일 정식 오픈 표준 선언)
2025년 8월 Security Review GitHub Action: 자기 보안 도구 → 오픈소스

이 패턴의 비즈니스 논리:

자기 인프라 공개:

외부 개발자가 같은 패턴으로 만들면 → 자연스럽게 Claude 우선 채택
표준 정착 → 전환 비용 증가
커뮤니티 기여 → 인프라 더 강해짐

대안 (비공개):

단기 차별화 유지
그러나 다른 회사가 자체 표준 만들 위험
시장이 분열되면 결국 모두 손해

Anthropic의 베팅: "오픈 표준을 우리가 정의하면 우리가 이긴다."

이 베팅이 2026년 현재 검증되고 있다. MCP는 사실상 산업 표준, Skills는 cross-platform 표준, Agent SDK는 가장 인기 있는 에이전트 빌더.

6. "30시간 자율 코딩"의 실제 의미

같은 날 발표 — Sonnet 4.5가 30+ 시간 동안 멀티스텝 작업에 집중 유지.

이게 가능한 건 단순히 모델만이 아니다. Agent SDK + Context Editing + Memory Tool 의 결합이다.

Sonnet 4.5 (모델 능력)
    +
Context Editing (단기 메모리 정리)
    +
Memory Tool (장기 메모리 영속)
    +
Agent SDK (도구 루프 자동화)
    =
30+ 시간 자율 작업

각각 따로는 의미가 작지만 함께 쌓이면 새 카테고리를 만든다. 1년 전(2024년)엔 30분 자율도 어려웠다. 이제 30시간이 가능해졌다.

이 변화가 의미하는 것 — AI 에이전트의 사용 모드 전환:

이전: 사용자가 옆에서 지켜봄
이후: 사용자가 잠자는 동안 작업

이게 background tasks, async workflows의 시대를 열었다. 2026년 현재 Claude Code 사용자가 "내일 아침 결과 확인" 모드로 작업 위임하는 게 일상이 됐다.

7. Skills와 Agent SDK의 관계

3개월 후(2025년 12월) Skills가 오픈 표준으로 발표됐다. Agent SDK와의 관계가 명확해졌다:

Agent SDK = "어떻게" (인프라, 루프, 도구 호출)
Skills = "무엇을" (도메인 능력, 절차 지식)

비유:

Agent SDK = 컴퓨터 (CPU, 메모리)
Skills = 소프트웨어 (전문화된 앱)

이 분리가 깔끔하다. Anthropic이 일반 에이전트 인프라(SDK)를 제공하고, 커뮤니티가 도메인 능력(Skills)을 기여하는 구조. Linux 커널 + 패키지 관리자 의 관계와 비슷하다.

2026년 현재 이 분리 위에서 풍부한 에코시스템이 구축됐다 — 회사들이 자기 도메인 Skill을 만들고 공유하고, Anthropic 자체가 표준 Skills (xlsx, docx, pptx, pdf 등)를 제공한다.

마무리

Claude Code SDK → Claude Agent SDK 리브랜딩은 이름 변경 그 이상이다. "코딩 에이전트 인프라가 일반 에이전트 인프라" 라는 통찰의 공식 인정이며, Anthropic이 OpenAI와 다른 길을 간다는 선언이기도 하다.

OpenAI의 길:

거대 단일 모델 (GPT-5)
소비자 제품 폭발 (Sora, Operator, Atlas)
자체 디스트리뷰션

Anthropic의 길 (이 글):

인프라 + 표준 강조
개발자 우선 (Agent SDK, MCP, Skills)
사내 검증 → 외부 공개 패턴

이 두 길이 2026년 시점에서 명확히 다른 결과를 만들고 있다. OpenAI는 소비자 시장 강자, Anthropic은 개발자·엔터프라이즈 표준. 둘 다 큰 시장이지만 운동의 방향은 다르다.

이 글의 한 줄이 그 방향성을 압축한다 — "The agent harness that powers Claude Code can power many other types of agents, too." 같은 인프라가 모든 에이전트의 기반이 된다는 베팅. 2026년 현재 이 베팅이 점점 더 진실로 드러나고 있다.