Claude 블로그 되짚어보기 #27 — Citations API, RAG의 마지막 마일을 해결한 신뢰 인프라 (2025)

panicdev·2026년 4월 22일

AI API Anthropic Citations Claude LLM rag 블로그리뷰

원문 정보

제목: Introducing Citations on the Anthropic API
링크: claude.com/blog/introducing-citations-api
발행: 2025년 1월 23일 (2025년 6월 30일 Amazon Bedrock 지원)
카테고리: Product announcements

글의 요지

Anthropic API에 Citations 기능이 공개됐다. Claude가 답변을 생성할 때 출처 문서의 구체적 문장·구절을 자동으로 인용하여, 모든 주장을 검증 가능한 원문에 연결할 수 있다.

기존 방식의 문제

지금까지 RAG 애플리케이션을 만들 때 Claude가 출처를 인용하게 하려면:

복잡한 프롬프트 엔지니어링으로 "답변 시 인용하라" 지시
인용 포맷 일관성 유지 어려움
모델이 지시를 무시하는 경우 빈번
인용 검증·링크 유지보수 부담

Citations가 하는 일

컨텍스트 윈도우에 소스 문서 첨부 → 쿼리 던지면 Claude가 자동 인용
인용은 구체적 문장·구절 단위
커스텀 솔루션 대비 더 일관된 성능
프롬프트 엔지니어링·테스트 시간 대폭 감소

가격 구조

입력 토큰: 소스 문서 크기만큼 과금
출력 토큰: 인용된 원문 그대로 재생성된 부분은 무료
~100페이지 문서 기준: Claude 3.5 Sonnet $0.30, Claude 3.5 Haiku $0.08

고객 사례

Thomson Reuters CoCounsel (법률 AI):

"CoCounsel이 변호사에게 신뢰받으려면 출처 인용이 필수다. 자체적으로 구현했는데 유지보수가 정말 어려웠다. Citations가 출발점이 됐다."
— Jake Heller, Head of Product, CoCounsel

Endex (금융 기관 자율 에이전트):

"Anthropic Citations로 소스 환각과 포맷 문제를 10%에서 0%로 줄였고, 응답당 참조 수가 20% 증가했다."

제공 플랫폼

Anthropic API (2025년 1월 23일 GA)
Google Cloud Vertex AI (2025년 1월 23일 GA)
Amazon Bedrock (2025년 6월 30일 추가)

2026년에 다시 읽으며 — 내가 본 것

1. "OpenAI Operator"의 그림자 아래에서 나온 타이밍

이 공지가 나온 2025년 1월 23일은 사실 하루 전에 OpenAI가 Operator(브라우저 에이전트)를 공개한 날이었다. TechCrunch 기자가 이걸 꼬집어서 썼다 — "Anthropic이 OpenAI Operator로부터 주의를 돌리려는 타이밍인지도 모른다."

Simon Willison의 분석이 특히 예리했다 — "이건 Anthropic과 OpenAI의 전략 차이를 잘 보여준다. OpenAI는 점점 소비자 제품 회사처럼 행동한다. Operator 브라우저 자동화는 화려한 소비자 제품의 재출시다. 반면 Anthropic은 명확히 개발자/엔터프라이즈 시장에 집중한다. Citations는 API-only, RAG 시스템을 만드는 개발자가 정말 필요했지만 스스로도 몰랐던 니즈에 답한다."

이 대비가 2026년까지 거의 그대로 유지됐다. OpenAI는 소비자 제품(ChatGPT, Sora, Atlas, Operator)에 자원 배분, Anthropic은 개발자 생태계(Claude Code, API, MCP, Skills, Cowork)에 집중. Citations는 이 대비의 초기 증거물이다.

2. RAG의 "마지막 마일"을 해결한 API

RAG(Retrieval Augmented Generation) 패턴의 기본은:

사용자 질문 받기
관련 문서 조각 검색
그 조각을 LLM 컨텍스트에 넣기
LLM이 답변 생성

이 패턴은 2023~2024년 수많은 기업이 도입했다. 그러나 마지막 마일 문제가 남았다 — "모델이 정말 이 문서에서 답을 가져왔는지" 확인할 방법이 없었다. 모델이 학습 데이터에서 답을 지어냈거나, 심지어 완전히 환각했을 수도 있다.

Citations는 이 마지막 마일을 API 수준에서 해결했다.

답변의 모든 주장 ← 원문의 구체적 문장과 연결
사용자가 인용을 클릭해 원문에서 직접 확인 가능
인용되지 않은 주장 = 환각 의심 신호

법률, 금융, 의료, 과학 같은 틀리면 치명적인 도메인에서 이 기능이 결정적이다. CoCounsel(법률), Endex(금융) 사례가 이를 증명한다. 2026년 현재 Citations는 이 산업들의 컴플라이언스 수준 AI 도입의 기본 인프라가 됐다.

3. "인용된 원문은 출력 토큰 무료" 가격 혁신

이 기능에서 가장 흥미로운 디테일 — 인용된 원문(직접 복사 인용)은 출력 토큰으로 과금되지 않음.

왜 이게 중요한가?

Claude가 "원문에서 500자 그대로 인용"해서 답에 포함 → 그 500자는 무료
환각 방지를 위해 긴 원문 인용을 넣어도 비용 부담 없음
개발자가 "인용을 많이 넣으면 비용 증가" 걱정 없이 안전하게 설계

이건 Anthropic의 의도된 인센티브 설계다. "가격 때문에 인용 절약"하지 않도록 구조를 짠 것. 사용자 신뢰 향상이 Anthropic의 장기 목표와 정렬된다.

이 패턴이 이후 확장됐다. Prompt Caching의 캐시 히트 요금 90% 할인, Batch API의 50% 할인, Extended Thinking의 thinking token과 답변 token 구분 — 모두 "좋은 관행을 택할 때 가격이 유리" 한 구조다.

4. "Search Result Content Blocks"로의 진화

2025년 1월의 Citations는 문서 업로드 기반이었다. 즉 사용자가 RAG 시스템에서 검색한 문서 조각들을 Claude에 넘기는 방식.

이후 2025년 8월경 Search Result Content Blocks가 별도로 공개됐다 (release notes에 "generally available on the Claude API and Google Cloud's Vertex AI. This feature enables natural citations for RAG applications with proper source attribution" 로 언급).

이 진화는 중요하다. Search Result Content Block은 검색 결과 전용 데이터 타입이다.

{
  "type": "search_result",
  "source": "https://docs.example.com/api",
  "title": "API Reference",
  "content": "..."
}

이 타입을 쓰면 Claude가 자동으로 URL 기반 인용을 생성한다. RAG 애플리케이션이 훨씬 깔끔해졌다. 2026년 현재 많은 AI 코딩 도구, 고객지원 봇, 법률 조사 AI가 이 Search Result Block 기반으로 돌아간다.

5. 웹 검색 API의 인용 구조로 계승

2025년 3월 Claude 웹 검색, 5월 웹 검색 API가 공개됐을 때 이 Citations 구조가 그대로 재활용됐다.

웹 검색 결과 → Search Result Content Block
Claude가 답변에 URL 기반 인용 자동 삽입
사용자가 출처 클릭 → 원문 확인

즉 Citations는 문서 인용 + 웹 인용 + 에이전트 도구 결과 인용 모두를 관통하는 공통 인프라가 됐다. "Claude가 어디서 정보를 가져왔는지 항상 추적 가능한" 제품 경험의 토대다.

6. 2026년, 인용이 "AI 신뢰의 표준 언어"가 된 이유

2025년 초만 해도 "AI가 인용을 붙이는 것" 은 특별한 기능이었다. 2026년 현재는 거의 기본값이다.

ChatGPT도 웹 검색 응답에 인용 붙임
Perplexity는 아예 인용 기반 UI
Gemini도 AI Overviews에 출처 링크
Claude는 모든 RAG/검색 응답에 Citations 기본

이 변화의 배경에는 AI 정보의 신뢰성 위기가 있다. 2024~2025년 AI 환각이 여러 공개 사건(법원 제출 문서에 AI 환각 판례 인용, 의료 권고 오류 등)으로 드러났다. 결과적으로 "AI가 말하는 것은 의심해야 한다" 는 일반 사용자 경계심이 커졌다.

이 경계심을 푸는 유일한 방법이 검증 가능성이다. 사용자가 "AI 답변 → 원문 확인"을 할 수 있으면 신뢰가 부분적으로 복원된다. Citations는 이 검증 가능성을 제품화한 최초의 주요 API다.

2026년 현재 AI 대상 SEO(LLMO), 출처 권위 측정, 브랜드 인용 최적화 같은 새로운 분야가 자리잡았다. 이 모든 것의 토대가 "AI가 출처를 공개하기 시작한" 2025년 초의 기능들이고, Citations는 그 중 가장 구조적인 예다.

마무리

Citations는 "RAG 시스템을 만드는 개발자의 숨겨진 니즈"를 정확히 찌른 API다. 표면적으로는 기술적인 기능 추가지만, 실제로는 AI 신뢰성에 대한 제품 수준의 답이었다.

2026년 시점에서 돌아보면 이 기능이 Anthropic 제품 철학을 명확히 보여준다:

검증 가능한 AI를 설계 목표로
개발자/엔터프라이즈에 우선 제공 (API-only)
가격 구조까지 신뢰 제고에 정렬
웹 검색, MCP, Search Result Blocks로 확장되는 공통 인프라

법률·금융·의료 같은 고신뢰 도메인에서 Claude가 주류가 되는 과정에서 이 Citations가 결정적 역할을 했다. 한 번의 API 업데이트가 "믿을 수 있는 AI" 라는 제품 브랜드를 만드는 데 기여한 좋은 예시다.

panicdev

이전 포스트

Claude 블로그 되짚어보기 #26 — Claude Code 원격 MCP, 터미널이 세상과 연결된 순간 (2025)

다음 포스트