RAG 성능 올리기 - Reranker

shin0112·2025년 5월 25일

졸업프로젝트

목록 보기

5/6

AI가 마케팅 문구를 읽고 "이건 그린워싱이다"라고 말할 수 있을까?
나는 이 질문에 답하기 위해, 한국 환경법 기준에 따라 그린워싱을 판단하는 RAG 시스템을 만들었다.

처음엔 단순히 언어모델만 잘 고르면 해결될 줄 알았다.
그런데 시스템을 만들다 보니, 검색 구조 자체가 성능에 큰 영향을 준다는 사실을 깨달았다.

내 시스템은 다음과 같은 문서를 기반으로 판단을 내린다.

처음에는 관련 문서를 한꺼번에 넣으면 더 정확하지 않을까 생각했다.
하지만 실제로는 모델이 너무 많은 정보를 주면 오히려 핵심을 놓치는 현상이 있었다.

이때 접하게 된 개념이 바로 Lost in the Middle이었다.

2023년 발표된 연구에 따르면,
LLM은 긴 입력에서 앞부분과 뒷부분은 잘 반영하지만, 중간에 위치한 정보는 놓치는 경향이 있다.

즉, 아무리 중요한 문서라도 프롬프트 중간에 들어가 버리면
모델은 그걸 무시한 채 판단을 내릴 수 있다.

Reranker는 검색된 문서들의 순서를 다시 정렬해주는 구성 요소다.
단순히 유사한 문서를 가져오는 것을 넘어, LLM이 먼저 읽어야 할 핵심 문서를 앞에 두도록 한다.

기본적으로는 두 가지 방식이 존재한다:

방식	설명	특징
Bi-encoder	질문과 문서를 각각 따로 임베딩 후, 코사인 유사도로 비교	빠르지만 문맥 정보 손실 가능
Cross-encoder	질문과 문서를 함께 입력해 정밀한 문맥적 관련성 평가	느리지만 정확함