같은 모델이 자기 코드를 리뷰하면 결함을 못 잡는다. 다른 모델로 리뷰하면 검출률이 올라간다.
Claude Opus가 코드 작성 → Claude Opus가 리뷰
→ "네, 이 코드는 잘 작성되었습니다" (자기가 쓴 거니까)
사람도 자기 글을 교정할 때 오타를 못 보는 것과 같은 원리.
AI는 이 편향이 더 심하다 — 같은 모델은 같은 사고 패턴을 공유하므로, 같은 맹점을 가진다.
작업 완료 → Gemini가 리뷰 (구조적 관점)
→ Claude Opus가 리뷰 (깊은 논리 분석)
→ Claude Sonnet이 리뷰 (실용적 관점)
→ Claude Haiku가 리뷰 (직관적 필터)
→ 4개 결과 병합
모델마다 역할이 다르다:
| 모델 | 역할 | 강점 |
|------|------|------|
| Gemini (API) | 구조적 일관성 | 수치 불일치, 네이밍 비일관성, 패턴 위반 |
| Claude Opus | 깊은 논리 분석 | 엣지케이스, 비즈니스 로직, 설계 판단 |
| Claude Sonnet | 실용적 관점 | 과잉 설계, 단순화, 구현 현실성 |
| Claude Haiku | 직관적 필터 | "이거 정말 필요해?", 최대 위험 하나 |
/검수 시스템 (4모델)기획 검수: Gemini + Opus + Sonnet + Haiku → 4개 병렬 실행 → 종합 보고서
코드 검수: Gemini + Opus + Sonnet + Haiku → 4개 병렬 실행 → 종합 보고서
보고서 5종 생성:
1. *-gemini.md — 구조적 일관성 발견
2. *-claude-opus.md — 깊은 논리 분석 발견
3. *-claude-sonnet.md — 실용성 평가
4. *-claude-haiku.md — 직관적 판단
5. *-final.md — 종합 (다수 공통 → 2모델 공통 → 단독 순으로 정리)
/검수처럼 한 명령으로 병렬 리뷰가 돌아가야 실제로 쓰게 된다# 1단계: git diff를 다른 모델에게 보내기
git diff | ./tools/code-review.sh output.md # Gemini 리뷰
# 2단계: 결과를 현재 세션에서 검토
# Claude가 Gemini 리뷰 결과를 읽고 동의/반박
# 3단계: /검수 커맨드로 원클릭 자동화