GPT Pro Codex vs Claude Code: 클린 환경에서 붙여본 지극히 주관적인 비교

Sean·2026년 2월 13일
post-thumbnail

누군가에게 알려주기 보다는 나 스스로 정리 하며 언젠가 다시 사용할 때를 대비하는 글을 작성할것이다.


사전 말씀

지극히 주관적인거고 뭔가 딥하게 설정을 잡아보고 한 것도 아니고 "아 그렇구나~" 정도로만 보면된다.
Codex 와 Claude Code의 방식이 완전히 다르고 이제 각각 그 고유 설정들을 다 잡아주면 아예 다른 결과가 나올 수 도 있으니까 말이다.


요약

클린 환경에서 GPT Pro(카톡)와 Claude Code를 붙여봤다.

  • 문서/기획/요약: Codex 우세
  • 코드 안정성과 완성도: Claude Code 우세
  • 디자인 감성: Codex 압승

근데 결론은 둘 다 그냥 미쳤다 라는거다 뭘 사용 하든 추가 작업이 필수라서 그것들을 해주고 사용면 그냥 다 최고의 결과를 뽑아낼 것이다.


왜 이 비교를 했나

이번에 카카오톡에서 ChatGPT Pro를 비교적 부담 없는 가격에 풀었고 나는 바로 결제했다. 하지만 나는 기존에 잘 쓰고 있던 Claude가 있었고 Claude Code와 실제 작업에서 얼마나 차이가 나는지 확인하고 싶었다.

실험 환경(클린 세팅)

  • 기존 세팅 전부 제거: CLAUDE.md, AGENTS.md, 스킬, MCP, 서브 에이전트
  • 빈 프로젝트에서 시작
  • 모델 기본 능력만으로 결과 확인

비교 절차

  1. 최신 모델(+think)에게 “수박게임을 아냐?” 질문
  2. 웹 게임 PRD.md 생성 요청
  3. Codex/Claude Code에 줄 프롬프트 설계 질문
  4. 빈 프로젝트에서 PRD + 프롬프트로 개발 시작
  • 시작

결과 요약(시간)

항목시간
시작10:35:57
Claude Code 완료10:44:52
Codex 완료11:00:51

시간만 보면 Claude Code가 더 빠르다. 하지만 핵심은 완성도였다.

  • Claude Code 결과물
  • Codex 결과물

디자인은 Codex가 압승, 안정성은 Claude Code

  • Codex 결과물은 디자인이 훨씬 세련됨
  • 하지만 오류 발생 + 게임 동작 불일치
  • Claude Code는 오류 없이 정상 동작, 다만 디자인은 무난한 수준

결론적으로 코딩 안정성과 완성도는 Claude Code, UI/디자인 감성은 Codex 쪽이 더 강했다.

  • 좌측이 Codex / 우측이 Claude Code

  • 게임오버 화면인데 코덱스로 만든건 오류가 있는것을 볼 수 있다.


Codex PRD + Claude 프롬프트 재실험

  • 작업 시간: 11:15:07 ~ 11:32:43

  • 결과: 오류 없이 정상 동작

  • 단점: 디자인은 여전히 무난

  • 결과물

시작튜토리얼게임 오버

문서화 비교

이전에 작업하던 프로젝트가 하나 있어서 이것을 분석하는 작업을 시켜봤다.

항목CodexClaude Code
문서 구조개요 → 상세 흐름이 깔끔분석용 형식, 읽기 피로도 큼
사용자 배려높음낮음
읽기 편함좋음아쉬움

정리 느낌은 Codex가 확실히 더 좋았다.


결론 (지극히 주관적 기준)

  • 세팅 없이 바로 쓸 때: 문서 작성/기획/계획 수립은 Codex가 유리
  • 실제 개발/코딩 단계: Claude Code가 더 안정적

다만 이건 완전 클린 상태 기준이다.
AGENTS.md, CLAUDE.md, 스킬, MCP, 서브 에이전트 등을 세팅하면 둘 다 결과가 크게 달라질거다.


한 줄 요약:
문서를 만들고 설계도를 그리는 단계는 Codex, 그 설계도를 실제 코드로 옮기는 단계는 Claude Code.


마치며

이번 비교는 철저히 내 주관과 실험 환경에 기반한 기록이다.
그리고 동작하는 방식도 완전 다를거고 그리고 그냥 대충 던져준거 하나로 비교라고 하기에는 둘 다 너무 뛰어나니 딱히 뭐가 안좋다라고는 하기에는 좀 그래도 직접 해보니 그 차이가 있었다.

그래서 개인적으로 둘 다 사용할 거 같은데 이제 그 의도를 잘 맞춰서 사용해볼 생각이다.

참고자료

기타

당연 틀린 부분 지적은 감사하나 비난은 정중하게 사양하겠다.

profile
"잘 할 수 있을까?"를 고민하기보단 재밌어 보이는건 일단 하고, 잘하기 위해 그냥 계속합니다.

2개의 댓글

comment-user-thumbnail
2026년 2월 25일

제가 GPT-5.2-Codex, Opus 4.6을 사용해서 AI가 있는 온라인 바둑 게임을 만드니까 오히려 코덱스가 클로드보다 퀄리티가 좋게 나오던데 여기 벨로그에서는 완전히 다르네요. 혹시 진행하실때 썻던 프롬포트나 깃허브 링크 같은거 있을까요? 완전 다른 결과가 나와서 궁금합니다

1개의 답글