RAG - Reranker

구조: [CLS] Query [SEP] Document [SEP] 형태 입력
장점: 쿼리와 문서를 동시에 분석 → 높은 정확도
단점: 연산량이 커서 대규모 데이터에 직접 적용 어려움
활용 방식: Retriever로 상위 k개 문서 추출 Cross Encoder로 세밀하게 재정렬

김소은·2025년 8월 19일

🔍 Reranker 완전 정리: Cross Encoder · Cohere · Jina · FlashRank 비교

검색 증강 생성(RAG) 시스템의 성능을 높이는 핵심 기술 중 하나가 바로 Reranker(리랭커)입니다.
이번 글에서는 Reranker의 개념과 다양한 구현 방식(Cross Encoder, Cohere, Jina, FlashRank)을 정리해보겠습니다.

Reranker는 두 단계 검색 시스템(Two-Stage Retrieval System)의 두 번째 단계에서 동작합니다.
Retriever가 빠르게 가져온 후보 문서들을 정밀하게 분석해 최종 순위를 재조정합니다.

👉 대표 모델: BAAI/bge-reranker
👉 LangChain: CrossEncoderReranker 사용

제공사: 오픈소스 중심 AI 기업 Jina AI
모델: jina-reranker-v2-base-multilingual
특징: 다국어 지원, API 방식
활용:
- JinaRerank를 ContextualCompressionRetriever와 함께 사용
- Retriever 결과를 API 기반으로 재정렬

구분	Cross Encoder	Cohere	Jina	FlashRank
장점	정확도 최고	다국어 지원	다국어 + API	초고속/경량
단점	연산 비용 큼	API키 필요	API 의존성	모델 제한
적합 상황	소규모 후보 정밀 분석	글로벌/다국어 서비스	다국어 검색	속도·효율 우선 환경

Retriever + Reranker = 최적 검색 파이프라인
- Retriever → 빠르게 후보 확보
- Reranker → 의미적 유사성 기반 정밀 재정렬
선택 기준:
- 정확도 중시 → Cross Encoder
- 다국어/클라우드 → Cohere, Jina
- 속도/로컬 경량화 → FlashRank