이전에서 OpenCode 설치와 ulw 모드 실험을 다뤘습니다.
이번엔 같은 PRD로 Claude Code까지 포함해 세 가지 환경을 비교해봤습니다.
LLM에게 많이 맡길수록 더 빠르지 않을까? 라는 예상과는 달리 결과는 반대였습니다.
서버 모니터링 대시보드를 동일한 PRD로 구현했습니다.
테스트 환경은 세 가지입니다. OpenCode + Z.ai(GLM-4.7) ulw 모드, OpenCode + Gemini ulw 모드, Claude Code 순정(Opus 계획 → Sonnet 구현).
OpenCode + Z.ai (ulw 모드)
프롬프트 1회, 에러 수정 1회. 총 27분 걸렸고 PRD 충족도는 80% 정도였습니다.
OpenCode + Gemini (ulw 모드)
프롬프트 1회, 에러 수정 2회. 총 33분 걸렸고 완성도는 90%까지 올라갔습니다.
Claude Code (Opus + Sonnet)
Opus로 계획 1회, Sonnet으로 구현 4회. 총 9분, 에러 수정 0회, 완성도 100%. 아이콘이나 단위 표시 같은 UI 디테일도 잘 나왔습니다.
OpenCode + ulw 모드
ulw 한 줄로 작업 전체를 맡길 수 있고, 병렬 에이전트로 여러 작업을 동시에 돌릴 수 있습니다. 대신 결과를 예측하기 어렵고, 에러가 나면 디버깅에 시간이 더 듭니다. spec-kitty처럼 절차가 중요한 워크플로우랑은 안 맞았습니다.
Claude Code (Opus + Sonnet)
Opus가 계획, Sonnet이 구현. 역할이 나뉘어 있어서 흐름이 명확합니다. 단계별로 승인하면서 방향을 잡아줄 수 있고, 에러 없이 끝나는 경우가 많았습니다. 대신 매번 확인해야 해서, 쭉 맡겨두고 싶을 땐 번거로울 수 있습니다.
입력 횟수만 보면 OpenCode가 적고 Claude Code가 많습니다.
하지만 실제 소요 시간은 반대였습니다.
중간에 방향을 잡아주는 게 오히려 더 빠르고 정확했습니다.
이번 테스트로 어떤 도구를 언제 써야 하는지 감이 잡혔습니다.
다른 조합들도 더 써보면서 정리해볼 생각입니다.