Claude Developer Platform에 두 가지 컨텍스트 관리 기능이 동시 추가됐다 — Context Editing 과 Memory Tool. Sonnet 4.5의 출시와 함께 공개된, 장시간 실행 에이전트를 위한 인프라.
장시간 에이전트의 가장 큰 적은 컨텍스트 윈도우 고갈. 도구 호출이 늘어날수록 오래된 결과가 컨텍스트에 쌓이고, 결국 토큰 한도에 부딪힌다. 이전 해결책 — "트랜스크립트 잘라내기 vs 성능 저하" 사이의 선택.
Context Editing이 하는 것:
keep 파라미터)활성화: clear_tool_uses_20250919 strategy + 베타 헤더 context-management-2025-06-27
파일 기반 영구 메모리 시스템. Claude가 /memory 디렉토리에 CRUD 작업 (Create, Read, Update, Delete).
특징:
본문이 강조하는 시너지:
함께 사용 시 자동 트리거:
100-turn 웹 검색 평가 (agentic search):
Coding: Context editing이 오래된 파일 읽기·테스트 결과 정리, Memory가 디버깅 인사이트·아키텍처 결정 보존
Research: Memory가 핵심 발견 저장, Context editing이 오래된 검색 결과 제거 → 시간이 갈수록 강해지는 지식 베이스
Customer Service: Memory가 고객 선호도·과거 이슈 보존, Context editing이 오래된 대화 정리
이 글이 솔직히 인정하는 것: 컨텍스트 윈도우는 정해진 한계가 있고, 무한히 늘려도 답이 안 된다.
2025년 8월 Sonnet 4의 1M 토큰 컨텍스트 출시 후 1개월 — Anthropic이 같은 회사로서 "1M도 부족해" 라고 인정한 셈이다. 이 인정의 배경에는 Context Rot 현상이 있다.
Anthropic 자체 엔지니어링 블로그가 정리한 개념:
"As the number of tokens in the context window increases, the model's ability to accurately recall information from that context decreases. Even before the hard context limit is reached, the agent may be getting less out of each token."
번역: "컨텍스트 토큰 수가 증가할수록 모델의 정확한 기억 능력은 감소한다. 하드 한계에 도달하기 전에도 토큰당 효용이 떨어진다."
이 사실이 의미하는 것: 컨텍스트 윈도우 키우기는 답이 아니다. 컨텍스트를 큐레이션하기가 답이다. Context Editing + Memory가 정확히 이 큐레이션 인프라다.
이 두 도구의 철학이 흥미롭다.
Context Editing: 빼는 도구 (subtractive)
Memory Tool: 쌓는 도구 (additive)
이 이분법이 인간의 메모리 구조와 닮았다.
이 구조가 LLM이 시간이 지나도 점점 똑똑해질 수 있는 토대가 된다. 매 세션마다 처음부터 시작하는 게 아니라, 누적된 메모리 위에서 더 잘 일한다.
100턴 웹 검색에서 토큰 사용량 84% 감소가 단순한 성능 메트릭이 아니다. 비용 메트릭이기도 하다.
기존:
Context Editing 적용:
이 절감이 에이전트 경제성의 결정적 변수다. 24시간 자율 에이전트가 경제성을 가지려면 토큰 비용이 통제되어야 한다. Context Editing이 그 통제를 가능하게 한다.
Memory Tool 설계의 가장 중요한 결정 — Anthropic 서버에 저장 안 함, 클라이언트가 저장.
대안 비교:
이 선택의 이유:
1) 데이터 주권: 기업 고객이 자기 데이터를 자기 인프라에 저장
2) 컴플라이언스: GDPR, HIPAA 같은 데이터 거주 규제 대응
3) 유연성: 파일, DB, S3, 어디든 가능
4) 단순성: Anthropic이 메모리 호스팅 인프라 운영 안 해도 됨
이 결정이 엔터프라이즈 수용성에 결정적이었다. 의료, 금융, 정부 같은 규제 산업이 "데이터가 우리 환경에서만 머문다" 는 보장 없이는 도입 안 한다.
Memory Tool과 Anthropic 자체의 CLAUDE.md 패턴 사이의 관계가 흥미롭다.
세 가지가 합쳐져서 Claude의 외부 지식 시스템을 형성한다.
Skills → 사전 정의된 능력 (정적)
CLAUDE.md → 프로젝트 컨텍스트 (정적)
Memory Tool → 대화 중 학습 (동적)
Context Editing → 단기 작업 공간 정리 (동적)
이 4계층 구조가 2026년 현재 Claude 에이전트의 표준 컨텍스트 아키텍처다.
Anthropic 엔지니어링 블로그가 인용한 사례:
"The agent maintains precise tallies across thousands of game steps—tracking objectives like 'for the last 1,234 steps I've been training my Pokémon in Route 1, Pikachu has gained 8 levels toward the target of 10.'"
번역: "에이전트가 수천 단계의 게임 진행을 정확히 기록한다 — 'route 1에서 1,234 단계 동안 피카츄를 훈련 중, 목표 레벨 10 중 8 달성' 같이."
이게 보여주는 것: Memory Tool은 코딩 도구가 아니라 일반 에이전트 인프라. 게임, 시뮬레이션, 장기 프로젝트 어디든 적용 가능.
이 일반성이 2026년 다양한 응용을 낳았다:
본문의 한 줄 — "Claude Sonnet 4.5 enhances both capabilities with built-in context awareness—tracking available tokens throughout conversations to manage context more effectively."
이게 결정적이다. Sonnet 4.5는 자기 컨텍스트 상태를 인식한다.
즉 모델 자체가 컨텍스트 매니저 역할을 한다. 외부 시스템 없이도 자기 한계를 관리.
이 능력은 Claude 4 시리즈가 에이전트 친화적 모델로 설계된 증거다. 2026년 현재 Opus 4.6/4.7은 이 컨텍스트 인식이 더 정교해져, 30+ 시간 자율 작업을 가능하게 한다.
Context Editing + Memory Tool의 출시는 에이전트 시대의 인프라 완성을 알리는 신호다.
2025년 9월 29일은 Sonnet 4.5 출시일이지만, 모델 그 자체보다 이 컨텍스트 관리 인프라가 더 큰 발전일 수 있다. 모델 성능 개선은 점진적이지만, 컨텍스트 관리 패러다임 변화는 에이전트의 가능성 자체를 바꿨다.
이 글 이후 6개월 — 2026년 4월 시점에서 보면 Memory Tool이 사실상 모든 진지한 에이전트의 기본 도구가 됐다. CLAUDE.md, Skills, Context Editing, Memory가 함께 짜내는 4계층 외부 지식 시스템 위에서 Claude는 진짜로 "기억하는 동료" 가 된다.