교차 모델 리뷰 — 자기 동의 편향 깨기

S_Soo100·2026년 4월 1일

ai

목록 보기
5/11

핵심 요약

같은 모델이 자기 코드를 리뷰하면 결함을 못 잡는다. 다른 모델로 리뷰하면 검출률이 올라간다.

패턴

문제: 자기 동의 편향 (Self-Agreement Bias)

Claude Opus가 코드 작성 → Claude Opus가 리뷰
→ "네, 이 코드는 잘 작성되었습니다" (자기가 쓴 거니까)

사람도 자기 글을 교정할 때 오타를 못 보는 것과 같은 원리.
AI는 이 편향이 더 심하다 — 같은 모델은 같은 사고 패턴을 공유하므로, 같은 맹점을 가진다.

해결: 4모델 병렬 교차 리뷰

작업 완료 → Gemini가 리뷰 (구조적 관점)
          → Claude Opus가 리뷰 (깊은 논리 분석)
          → Claude Sonnet이 리뷰 (실용적 관점)
          → Claude Haiku가 리뷰 (직관적 필터)
          → 4개 결과 병합

모델마다 역할이 다르다:
| 모델 | 역할 | 강점 |
|------|------|------|
| Gemini (API) | 구조적 일관성 | 수치 불일치, 네이밍 비일관성, 패턴 위반 |
| Claude Opus | 깊은 논리 분석 | 엣지케이스, 비즈니스 로직, 설계 판단 |
| Claude Sonnet | 실용적 관점 | 과잉 설계, 단순화, 구현 현실성 |
| Claude Haiku | 직관적 필터 | "이거 정말 필요해?", 최대 위험 하나 |

실전 구현

ideaBank의 /검수 시스템 (4모델)

기획 검수:  Gemini + Opus + Sonnet + Haiku → 4개 병렬 실행 → 종합 보고서
코드 검수:  Gemini + Opus + Sonnet + Haiku → 4개 병렬 실행 → 종합 보고서

보고서 5종 생성:
1. *-gemini.md — 구조적 일관성 발견
2. *-claude-opus.md — 깊은 논리 분석 발견
3. *-claude-sonnet.md — 실용성 평가
4. *-claude-haiku.md — 직관적 판단
5. *-final.md — 종합 (다수 공통 → 2모델 공통 → 단독 순으로 정리)

i-spider의 review 스킬

  • Architect(Opus)가 쓴 계획을 Implement(Sonnet)가 구현
  • Review 스킬이 "계획 vs 실제" 비교 — 다른 세션이므로 맥락이 분리됨
  • 추가로 외부 모델(Codex 등)로 보완 리뷰 가능

결과

교차 리뷰에서 실제로 잡힌 것들

  • Gemini가 잡고 Claude가 놓친 것: 스펙 문서 간 수치 불일치, 네이밍 비일관성
  • Claude가 잡고 Gemini가 놓친 것: 런타임 엣지케이스, 비동기 타이밍 이슈
  • 둘 다 잡은 것: 누락된 에러 처리, 미사용 코드 (이건 높은 신뢰도)
  • Haiku의 직관: "이 시스템 자체가 불필요하다" 수준의 과감한 판단 (2026-03-20 개선안 검토에서 B, C를 깔끔하게 No 판정)

신뢰도 기준 (4모델 체계)

  • 3~4개 모델 공통 지적: 거의 확실한 결함 → 반드시 수정
  • 2개 모델 공통 지적: 높은 신뢰도 → 수정 권장
  • 1개 모델 단독 지적: 오탐 가능성 → 확인 후 판단

비용 대비 효과

  • Gemini: 무료 한도 내 (Gemini Flash API)
  • Claude Opus/Sonnet/Haiku: 구독 내 포함
  • 추가 비용 거의 없이 4개 관점 확보

교훈

  1. 3개 이상 모델이 지적한 이슈는 거의 확실한 결함이다 — 최우선 처리
  2. 1개 모델만 지적한 이슈는 검토가 필요하다 — 오탐(false positive)일 수 있음
  3. 리뷰 결과는 파일로 저장한다 — 대화 컨텍스트는 날아가지만 파일은 남는다
  4. 자동화할수록 좋다/검수처럼 한 명령으로 병렬 리뷰가 돌아가야 실제로 쓰게 된다

도입 최소 단위

# 1단계: git diff를 다른 모델에게 보내기
git diff | ./tools/code-review.sh output.md  # Gemini 리뷰

# 2단계: 결과를 현재 세션에서 검토
# Claude가 Gemini 리뷰 결과를 읽고 동의/반박

# 3단계: /검수 커맨드로 원클릭 자동화
profile
Ai agent 설계를 잘 하고싶은 개발자

0개의 댓글