2023~2024년에 등장했던 대부분의 코딩 에이전트는 솔직히 말해 실사용하기 어려웠다.
자율성은 과했고, 정확도는 낮았으며, 디버깅 비용이 사람보다 컸다.
그런데 2025년 말부터 분위기가 바뀌었다.
Claude Code, Codex, Cursor Agent 같은 도구들이 실제 개발 워크플로우에 들어오기 시작했다.
이 강연은 그 이유를 “감각적 경험”이 아니라 아키텍처 관점에서 설명한다.
강연자가 던지는 질문은 단순하다.
“모델이 좋아진 것 말고,
코딩 에이전트를 실제로 가능하게 만든 변화는 무엇인가?”
답은 의외로 화려하지 않다.
Claude Code를 포함한 최신 코딩 에이전트들의 공통 구조는 거의 같다.
while (tool_call_exists):
run_tool()
feed_result_back()
end
이게 전부다.
이 구조가 가능한 이유는 단 하나다.
모델이 이제 “실수 → 수정”을 반복할 만큼 충분히 똑똑해졌기 때문
강연에서 반복되는 메시지는 이것이다.
모델의 한계를 코드로 보완하려 하지 마라
모델에게 도구를 주고, 방해하지 마라
이건 무책임한 낙관이 아니다.
오히려 엔지니어링 관점에서의 보수적인 선택이다.
Anthropic 내부에서도 이 철학을 이렇게 부른다.
“모델 결함을 중심으로 아키텍처를 짜지 말 것”
Claude Code의 도구들은 매우 제한적이다.
공통점은 하나다.
전부 사람이 터미널에서 하던 행동
새로운 개념의 도구는 거의 없다.
RAG도, 벡터 DB도 없다.
대신 grep이 있다.
이게 중요한 이유는 명확하다.
강연자가 여러 번 강조한 포인트:
사실 bash 하나만 있어도 에이전트는 성립한다
이유는 두 가지다.
범용성
학습 데이터
Claude Code가
임시 Python 파일을 만들고 → 실행하고 → 지우는 이유도 여기에 있다.
흥미로운 부분 중 하나는 to-do 시스템이다.
그런데도 잘 동작한다.
왜냐하면:
이건 1~2년 전에는 불가능했던 일이다.
과거 에이전트 설계는 대부분 이런 모습이었다.
강연자의 결론은 단호하다.
일반 목적 에이전트에는 DAG가 최악의 선택이다
반면:
Claude Code의 task는 핵심적인 설계다.
이게 중요한 이유는 하나다.
컨텍스트가 길어질수록 모델은 멍청해진다
그래서:
Skills는 마법이 아니다.
하지만 의미는 명확하다.
컨텍스트를 항상 들고 있지 말고
필요할 때만 로드하라
이런 것들은
강연에서 인상적인 개념 하나:
“Agent smell”
정확한 정답을 채점하는 건 어렵다.
대신 행동 패턴을 측정한다.
또 하나의 현실적인 방법:
강연자의 예측은 이렇다.
이유는 간단하다.
다만:
이 강연의 메시지는 매우 명확하다.
코딩 에이전트의 진짜 혁신은
“AI가 똑똑해졌다”가 아니라
“엔지니어가 덜 개입하기 시작했다”는 점이다.