[Harness] 0. AI Agent에서 Harness란 무엇인가

류지수·2026년 5월 28일

Harness Engineering for AI Agents

목록 보기

1/2

최근 AI Agent 도메인 내 Harness 용어 노출 빈도가 급증하고 있다.

사실 Harness 자체는 새로운 개념이 아니다. 기존 소프트웨어 엔지니어링 영역에서 수십 년간 검증된 패러다임에 수렴한다.

Test Harness: 테스트 실행 환경 및 제어 프레임워크
Simulation Harness: 가상 환경 모킹 및 인터페이스 계층
Runtime Harness: 어플리케이션 실행 라이프사이클 관리

LLM Agent 문맥에서는 2023년 이후 시스템 안정성 확보를 위한 핵심 아키텍처로 부상하는 추세다.

Harness란 무엇인가

하네스(Harness)는 AI 에이전트 아키텍처에서 모델(LLM)을 제외한 실행 및 제어 계층(Runtime Layer) 전체를 의미한다.

Agent = Model + Harness

여기서 Harness는
모델 자체를 제외한 Runtime 계층 전체를 의미.

특히 Coding Agent 문맥에서는

System Prompt
Memory
Tool Runtime
Planner
Retry Logic
Verification
Sandbox
Tracing

같은 실행 계층까지 포함하는 경우가 많음.

Prompt만으로 Agent 구성 어려움

초기 LLM Agent 시스템은 Prompt Engineering 중심 구조 비중 높음.

좋은 Prompt 작성 $\rightarrow$ 더 안정적인 Agent 생성
같은 접근 방식

하지만 작업 규모 증가와 함께 여러 한계 노출이 되기 시작했는데

특히 Long-running task 환경에서

Context Overflow
상태 손실
Tool 선택 오류
실패 루프 반복

작업 길이 증가와 함께
state consistency 유지 비용 증가.

예를 들어

"React 기반 Dashboard 애플리케이션 생성"

같은 작업 수행 시 초기 결과는 자연스럽게 생성되는 경우가 많음.

하지만 작업 규모 증가 이후:

파일 구조 붕괴
import 관계 충돌
기존 요구사항 망각
테스트 실패 상태 유지

현상 반복.

즉, 문제 핵심은 단순 생성 능력보다

작업 상태 유지

오류 복구

영역에 더 가까움.
그리고 이 영역 담당 주체가 바로 Harness

Agent의 핵심 문제는 generation보다 execution 영역에 가까워지는 중.

Harness의 핵심 역할

Harness 목적은 모델 capability 확장보다
실행 안정성 확보에 가까움.

오히려 핵심은 아래와 같음

실행 상태 유지
실패 복구
결과 검증
Runtime 안정성 확보

대부분 Agent Harness 내부에는 아래 요소 포함하는데

User
 ↓
Harness
 ├─ Prompt
 ├─ Memory
 ├─ Planner
 ├─ Tool Router
 ├─ Verifier
 ├─ Retry Loop
 ├─ Sandbox
 └─ Tracing
 ↓
LLM

각 요소 역할이 분리되어 있다.

Memory

장기 Context 유지

Tool Runtime

외부 시스템 실행

Verifier

결과 검증

Retry Loop

실패 상태 복구

Tracing

실행 흐름 추적

즉 Harness는 단순 Prompt Wrapper가 아님

LLM을 실제 작업 환경에서 안정적으로 실행하기 위한 Runtime System에 가깝다.

왜 최근 중요성이 커지는가

최근 Agent 시스템 경쟁력은
단순 모델 크기보다 Runtime 구조 영역으로 이동 중.

특히:

Context Management
Tool Orchestration
Verification Loop
Runtime Control

중요성 증가.

대표 사례로는 Cursor, Claude, OpenHands 이런 시스템들은 단순 Prompt Layer보다 Runtime Layer 설계 비중이 확대되어 있음

실제 최근 Agent 분야에서는

과거에는:

좋은 Agent = 좋은 Model

관점 비중이 높았다면,

최근에는:

좋은 Agent = 좋은 Harness

방향으로 이동 중.

관점으로 확산 중이다.

마무리

Prompt Engineering 시대 핵심은:
어떻게 생성할 것인가

반면 최근 Agent 시스템 핵심은:

상태 유지
실행 제어
실패 복구
결과 검증

즉, Agent 중심 문제는 generation보다 execution 영역으로 이동 중.

Harness는 이런 Runtime Layer 전체를 설명하는 개념으로 자리잡는 중.

참고

Martin Fowler — Harness Engineering

류지수

끄적끄적

다음 포스트