[논문 리뷰 - 3] Retrieval-Augmented Generation for Large Language Models: A Survey

shanny·2025년 4월 20일

논문리뷰

논문 리뷰

목록 보기

14/42

‼️ 개인 학습 내용으로, 오류가 있을 수 있습니다.

논문 URL - https://arxiv.org/abs/2312.10997

Overview of RAG

RAG의 개념과 필요성
- 기존 ChatGPT 등 대형 언어모델(LLM)은 학습 시점 이후의 최신 정보나 특정 전문 지식이 부족하다는 한계가 있다. 예를 들어, 최근 뉴스와 같이 최신 이슈에 대해 질문하면 답변이 어렵다.
- RAG(Retrieval-Augmented Generation)는 이러한 한계를 극복하기 위해 외부 데이터베이스(뉴스, 문서 등)에서 관련 정보를 검색하여, 질문과 함께 LLM에 전달함으로써 더 정확하고 최신의 답변을 생성하는 기술이다.
RAG의 발전 단계
- RAG 연구는 크게 세 단계(Naive RAG, Advanced RAG, Modular RAG)로 발전해왔다.
- 기본 RAG(Naive RAG)는 단순히 질문과 유사한 문서를 검색 후 LLM에 입력해 답변을 생성한다. 비용 효율적이고 성능이 개선되지만, 검색 정확도와 답변 품질, 문맥 통합 등에서 한계가 있다.
- 고급 RAG(Advanced RAG)는 검색 및 생성 품질을 높이기 위해 검색 전/후 절차, 파이프라인 최적화 등 다양한 기법이 적용된다.
- 모듈형 RAG(Modular RAG)는 여러 기능을 모듈화해 유연성과 확장성을 높인 최신 패러다임이다. 각각의 한계를 극복하기 위해 발전하고 있다.
RAG의 효과와 적용 사례
- RAG는 LLM의 환각(hallucination) 현상을 줄이고, 최신성·전문성·객관성을 강화할 수 있다.

01. Naive RAG

기본 구조

ChatGPT 대중화 직후 주목받은 초기 방법론으로, 인덱싱·검색·생성(Retrieve-Read)의 전통적 3단계 프레임워크를 따른다.
이는 외부 데이터베이스에서 문서를 검색해 LLM이 읽고 답변을 생성하는 기본 구조를 가진다.
Indexing
- PDF, HTML, Word, Markdown 등 다양한 형식의 원본 데이터를 정제 및 추출해 일반 텍스트로 변환한다.
- 이후 언어 모델의 문맥 제약을 고려해 텍스트를 작은 조각으로 분할하고, 임베딩 모델을 통해 벡터 표현으로 변환한 후 벡터 데이터베이스에 저장한다.
- 이 과정은 후속 검색 단계에서 효율적인 유사도 검색을 가능하게 하는 핵심 단계다.
Retrieval
- RAG 시스템은 사용자의 쿼리를 인덱싱 단계와 동일한 임베딩 모델로 벡터화한 후, 인덱스된 텍스트 조각(Chunk)들과의 유사도를 계산해 상위 K개를 선별한다.
- 이렇게 검색된 조각들은 확장된 문맥으로 활용되어 프롬프트에 통합된다.
Generation
- RAG 시스템은 사용자 질의와 검색된 문서를 결합해 일관된 프롬프트를 생성하며, LLM은 이를 바탕으로 답변을 작성한다.
- 이때 모델은 사전 학습된 지식 또는 제공된 문서에 한정된 정보를 활용할 수 있으며, 대화 기록이 포함된 경우 이를 프롬프트에 통합해 다중 회차 상호작용이 가능하다.

직면한 문제

Retrieval Challenges
- 검색 단계는 정밀도와 재현율 문제로 인해 관련 없는 조각을 선택하거나 핵심 정보를 놓치는 한계가 있다.
Generation Difficulties
- 생성 단계에서는 검색된 문맥과 무관한 환각(hallucination) 현상이 발생할 수 있으며, 무관성·유해성·편향성 문제로 답변의 품질과 신뢰성이 저해된다.

Augmentation Hurdles
- 검색 정보와 다양한 작업의 통합 과정에서 발생하는 문제를 의미한다.
- 검색된 정보의 불일치로 인해 결렬되거나 일관성 없는 출력이 생성될 수 있으며, 다중 출처에서 유사 정보가 중복 검색될 경우 반복적 응답 문제가 발생한다.
- 각 문단의 중요도·관련성 판단과 문체·어조 일관성 유지도 복잡성을 가중시킨다.
- 단일 검색으로는 충분한 맥락 확보가 어려운 경우가 많으며, 생성 모델이 검색 내용에 과도하게 의존해 통찰력이나 종합적 분석 없이 단순 반복하는 결과를 초래할 위험도 존재한다.

02. Advanced RAG

특징

Naive RAG의 한계를 극복하기 위해 검색 품질 향상에 집중한다.
사전 검색(전처리) 및 사후 검색 전략을 도입하고, 인덱싱 기법을 슬라이딩 윈도우, 세분화된 분할, 메타데이터 통합 등을 통해 개선한다.
또한 검색 프로세스 최적화를 통해 효율성을 높인다.
사전 검색 과정(검색 품질 향상)
- 인덱싱 최적화 : 데이터 세분화 강화, 인덱스 구조 개선, 메타데이터 추가, 정렬 최적화, 혼합 검색(밀집/희소 검색 병행)을 통해 검색 대상 콘텐츠의 품질을 향상시킨다.
- 질의(쿼리) 최적화: 질의 재구성(rewriting), 변환(transformation), 확장(expansion) 등 기법으로 원본 질의를 명확하게 개선해 검색 적합도를 높인다
사후 검색 과정(검색된 문맥을 효과적으로 통합)
- 재순위화(rerank) : LlamaIndex, LangChain, HayStack 등의 프레임워크에서 검색된 청크의 관련성 점수를 재평가해 프롬프트의 시작/끝 부분에 핵심 내용을 배치함으로써 LLM의 주의 집중도를 높인다.
  - 이 컨셉을 사용한 사례 - LlamaIndex, LangChain, HayStack
- 문맥 압축(context compressing) : 불필요한 정보를 제거하거나 핵심 문장을 추출해 LLM이 처리할 문맥 길이를 단축함으로써 정보 과부하 및 관련성 저하 문제를 해결한다

03. Modular RAG

특징

모듈형 RAG는 기존 RAG 패러다임(Naive, Advanced)을 발전시켜 유연성과 적응성을 강화한 아키텍처다.
검색 모듈 추가, 리트리버 미세 조정(fine-tuning), 모듈 재구성 및 파이프라인 재배치 등 다양한 전략을 통해 개별 컴포넌트를 최적화한다.
순차 처리와 종단간 통합 학습(end-to-end)을 모두 지원하며, 모듈 교체·확장을 통해 특정 과제에 맞춤화된 설계가 가능하다.
핵심 원칙은 기존 RAG와 동일하지만, 모듈화를 통해 성능과 확장성을 혁신적으로 개선했다.

1. 새로운 모듈

모듈형 RAG는 전문화된 추가 모듈을 도입해 검색 및 처리 역량을 강화한다.
(검색 프로세스 효율화와 정보의 정확성·유연성을 동시에 확보)

검색 모듈: LLM 생성 코드/쿼리 언어를 활용해 검색엔진·DB·지식그래프 등 다양한 데이터 소스 직접 탐색
RAG-Fusion: 다중 쿼리 전략으로 사용자 질의를 확장하고, 병렬 벡터 검색·재순위화를 통해 명시적·변형적 지식을 포착
메모리 모듈: LLM 메모리를 활용해 무제한 메모리 풀 구축 및 데이터 분포 맞춤형 검색 유도
라우팅: 질의 유형(요약·특정 DB 검색·정보 통합 등)에 최적 경로 선택
예측 모듈: LLM이 직접 문맥을 생성해 잡음·중복 제거
태스크 어댑터: 제로샷 입력 시 자동 프롬프트 검색, 퓨샷 쿼리 생성으로 작업별 맞춤형 리트리버 구현

2. 새로운 패턴

모듈형 RAG는 모듈 교체/재구성을 통해 기존 RAG의 고정된 구조("검색-읽기" 메커니즘)를 넘어 유연성을 극대화한다.
새로운 모듈 통합 및 기존 모듈 간 상호작용 흐름 조정을 통해 다양한 작업에 적용 범위를 확장한다.

Rewrite-Retrieve-Read : LLM 기반 쿼리 재작성 모듈과 피드백 메커니즘으로 검색 질의 최적화
Generate-Read : 전통적 검색 대신 LLM이 직접 콘텐츠 생성
Recite-Read : 모델 가중치 내부 지식을 검색해 지식 집약적 작업 처리 강화
하이브리드 검색 : 키워드·의미·벡터 검색 통합
Hypothetical document embeddings(HyDE) : 생성된 답변과 실제 문서 간 임베딩 유사도 활용해 검색 관련성 향상

모듈형 RAG는 모듈 간 동적 조정·협업 전략을 통해 고도화된 유연성을 구현한다.

DSP(Demonstrate-Search-Predict)와 ITER-RETGEN(iterative Retrieve-Read-Retrieve-Read)은 모듈 출력을 상호 연계해 검색-생성 시너지를 극대화한다.
FLARE와 Self-RAG는 적응형 검색 기법으로 시나리오 기반 필요성 판단 후 동적 정보 수집이 가능하다.
외부 기술 통합: 미세 조정(Fine-tuning)·강화학습(Reinforcement Learning)과 결합해 리트리버 성능 개선 및 생성 모델의 개인화 출력을 구현한다.

04. RAG vs. Fine-tuning

LLM 최적화 기법으로 RAG, 파인튜닝(FT), 프롬프트 엔지니어링이 차별적 특성을 보인다.

프롬프트 엔지니어링: 모델의 내재적 역량을 활용하며 외부 지식/모델 수정 필요성 최소화
RAG: 외부 데이터베이스를 "맞춤 교과서"처럼 활용해 정밀 정보 검색에 특화
- 장점: 실시간 지식 업데이트 가능, 외부 지식원 활용 및 해석 용이성 우수
- 단점: 처리 지연 시간(latency)이 오래 걸림, 데이터 검색 관련 윤리적 문제 발생 가능성
Fine-Tuning(FT): 특정 스타일·구조 재현에 적합하며, 지식을 모델 내부에 체화하는 방식
- 장점: 모델 행동·스타일 심층 커스터마이징 가능, 환각(hallucination) 현상 감소
- 단점: 업데이트 시 재학습 필요, 데이터셋 준비·학습에 고성능 컴퓨팅 자원 요구, 비익숙 데이터 처리 한계
  
  구분 외부 지식 요구도 모델 적응 요구도
  프롬프트 엔지니어링 낮음 낮음
  RAG 높음 중간
  Fine-Tuning 중간 높음
성능 비교
- RAG : 비지도 미세 조정(unsupervised FT)보다 기존 및 새로운 지식 기반 작업에서 일관되게 우수한 성능을 보인다.
- LLM : 비지도 미세 조정으로 새로운 사실 정보를 습득하는 데 어려움을 겪는다.
선택 기준
- RAG : 동적 데이터 환경·실시간 정보 업데이트 필요 시 적합
- Fine-Tuning : 특정 도메인 전문성·스타일 맞춤화 요구 시 유리
상호 보완
- RAG와 FT 병행 사용 시 모델 성능 극대화 가능
- 최적화를 위해 다중 반복 프로세스가 필요

구분	외부 지식 요구도	모델 적응 요구도
프롬프트 엔지니어링	낮음	낮음
RAG	높음	중간
Fine-Tuning	중간	높음

Retrieval

A. Retrieval source

RAG 시스템에서 문서 검색 효율성은 외부 지식원 유형, 검색 단위 세분화, 전처리, 임베딩 모델 선택 등에 의해 결정된다.

검색 소스

데이터 구조
- Unstructured Data
  - 비정형 데이터는 주로 코퍼스(corpus)에서 수집된 텍스트 형태로 가장 널리 사용되는 검색 소스다.
    - 개방형 질의응답(ODQA): 위키피디아 덤프(HotpotQA 4, DPR5)가 주요 검색 소스로 활용된다.
    - 다국어 텍스트: cross-lingual 데이터 및 의료·법률 도메인 특화 자료가 추가 소스로 사용된다.
- Semi-structured Data
  - 반구조화 데이터(텍스트와 테이블이 혼합된 PDF 등) 처리는 기존 RAG 시스템에 두 가지 주요 도전 과제를 제기한다.
    1. 텍스트 분할 문제: 테이블 구조가 분할 과정에서 손상되어 데이터 무결성이 훼손된다.
    2. 의미적 검색 복잡성: 테이블 포함 시 벡터 검색 정확도가 저하된다.
  - 현존 접근법
    - Text-2-SQL: LLM의 코드 생성 능력을 활용해 데이터베이스 내 테이블 직접 쿼리
    - 테이블 텍스트 변환: 테이블을 자연어 형식으로 변환 후 처리
    - 한계: 두 방법 모두 최적화되지 않아 연구 개선 여지가 크다.
- Structured Data
  - 구조화된 데이터는 RAG 시스템에서 정확한 정보 검색과 품질 향상을 위해 핵심적으로 활용되며, 특히 지식그래프(KG)와 같은 검증된 구조가 주로 사용된다.
    - 주요 기술 및 장점
      1. KnowledGPT: 지식베이스(KB) 검색 쿼리 생성 및 개인화된 지식 저장을 통해 RAG의 지식 풍부성 강화
      2. G-Retriever: 그래프 신경망(GNN)·LLM·RAG 통합으로 텍스트 그래프 이해 및 질의응답 능력 향상
      3. PCST(Prize-Collecting Steiner Tree) 최적화 기법을 활용한 타겟형 그래프 검색 구현
      4. GNN-RAG: KGQA 작업에서 GPT-4 성능을 능가하는 다중 홉·다중 엔터티 질문 처리 능력
    - 도전 과제(구조화 데이터 관리)
      - 검증·유지보수를 위한 추가 리소스 필요
      - 도메인 특화 지식그래프 구축의 높은 초기 비용
- LLMs-Generated Content
  - LLM 생성 콘텐츠 활용 연구는 RAG의 외부 정보 의존 한계를 극복하기 위해 LLM의 내부 지식을 적극적으로 활용한다.
    - SKR: 질문을 "알려진 것"과 "알려지지 않은 것"으로 분류해 검색 강화를 선택적으로 적용
    - GenRead : 검색기 대신 LLM 생성기를 사용해 사전 학습 목표와 일관된 정확한 문맥 생성
    - Selfmem : 무한 메모리 풀을 구축하고 이중 문제 생성 기반으로 생성 모델을 점진적 개선

검색 세분성

검색 단위 세분화는 RAG 시스템 성능에 중요한 영향을 미친다.
- 거친 단위(coarse-grained): 관련 정보 포함량은 많지만 잡음(불필요한 내용) 증가 가능성 있음
- 세밀한 단위(fine-grained): 정밀도 향상 가능성 있으나 검색 부담 증가 및 의미적 무결성 저해
검색 세분화 단위는 텍스트와 지식그래프(KG) 영역에서 다양한 수준으로 구분되며, 하류 작업에 맞춰 적응적으로 적용된다.
- 텍스트 기반 검색 세분화
  - 세밀한 단위: 토큰·구(Phrase)·문장·명제(Proposition)·청크
  - 명제(Proposition): 단일 사실을 포함한 원자적 표현으로, DenseX1에서 제안된 고정밀 검색 단위
  - 거친 단위: 문서(Document) 수준
- 지식그래프(KG) 기반 검색 세분화
  - 엔티티(Entity): 개별 개념 단위
  - 트리플렛(Triplet): (주체-관계-객체) 3요소 구조
  - 서브그래프(Sub-Graph): 관련 노드·엣지 집합
- downstream 작업 맞춤형 세분화
  - 추천 시스템: 아이템 ID 기반 검색
  - 기계 번역: 문장 쌍(Sentence Pair) 단위 검색

B. Indexing Optimization

RAG 인덱싱 단계에서 문서 처리 및 청킹 전략은 검색 정확도와 효율성을 결정한다.
청킹 전략 핵심 요소
- 고정 토큰 분할: 100/256/512 토큰 단위 분할이 일반적
- 장점: 구현 간편성
- 단점: 문맥 단절 가능성
- 재귀 분할/슬라이딩 윈도우: 계층적 검색을 통해 전역적 문맥 정보 통합
- Small2Big:
  - 소형(Small): 문장 단위 검색
  - 대형(Big): 인접 문장을 포함한 확장 컨텍스트 제공
메타데이터 활용은 RAG 시스템의 검색 정확도와 컨텍스트 적합성을 개선하는 핵심 전략이다.
메타데이터 부착 전략
- 기본 메타데이터: 페이지 번호, 파일명, 작성자, 카테고리, 타임스탬프 등을 청크에 추가
- 시간 인식 검색: 문서 타임스탬프에 가중치 부여해 최신 정보 우선 검색
- 인공 메타데이터 생성:
  - 문단 요약: LLM을 활용해 청크 내용을 요약한 메타데이터 추가
  - 가설 질문 생성(Reverse HyDE): 문서에서 답변 가능한 질문을 LLM으로 생성 후, 원본 질의와의 유사도 계산
계층적 구조 인덱스(Structural Index) 구축은 문서 간 관계를 체계화해 RAG 시스템의 검색 속도와 데이터 처리 효율성을 향상시키는 핵심 전략이다.
- 계층적 인덱스 구조 : 부모-자식 관계로 문서를 조직화하고, 각 노드에 데이터 요약을 저장해 신속한 탐색을 지원한다.
- 지식 그래프 인덱스 : 문서 계층 구조 구축 시 개념·엔터티 간 관계를 명확히 정의해 RAG 시스템의 일관성과 정확도를 향상시킨다.
  - 주요 기능 :
    - 의미적 관계 명시화: 문서 내 문단·표·페이지 노드 간 유사도/구조적 관계를 엣지로 연결
    - 다중 문서 통합: KGP1 프레임워크는 KG를 통해 문서 간 지식 검색·추론 문제 해결

C. Query Optimization

Naive RAG의 주요 문제점
- 질의 의존성: 사용자 원문 질의를 그대로 검색에 사용해 부정확한 결과 초래
- 모호한 약어 처리: "LLM"과 같은 전문 용어의 다중 의미 구분 실패(예: 대규모 언어 모델(Large Language Model) vs 법학 석사(Master of Laws))
- 언어 복잡성: 전문 용어·구조화되지 않은 질문 처리 능력 부족
쿼리 확장 및 검증 기법

쿼리 확장(Query Expansion)
- 목적: 단일 질의를 다중 질의로 확장해 문맥적 뉘앙스 보강 및 답변 관련성 극대화
- 방식:
  - Multi-Query: LLM을 활용해 질의를 병렬 처리 가능한 다중 하위 질문으로 변환
  - Sub-Query : 복잡 질문을 단순 하위 질문으로 분해(예: Least-to-Most 프롬프팅)
검증 체인(Chain-of-Verification, CoVe)
- 목적: 확장된 쿼리의 할루시네이션(hallucination) 감소 및 신뢰도 향상

쿼리 변환(Query Transformation)
- 목적: 사용자 원본 질의를 변환해 검색 정확도 및 LLM 응답 품질 향상
- 전략: 질의 재작성, 가상 문서 생성, 추상화 질문 생성 등을 활용
- 주요 방법
  1. 질의 재작성(Query Rewrite)
    - LLM 활용: 원본 질의를 최적화된 형태로 재구성(예: "최신 스마트폰 비교" → "2024년 삼성/애플 플래그십 스마트폰 기능 비교")
    - 전용 모델(RRR): 검색 효율성 개선을 위한 소규모 언어 모델 적용
    - BEQUE 사례: 타오바오에서 long-tail 질의 검색 재현율 향상 및 GMV 증가 달성
      * Gross Merchandise Volume(총 상품 거래액)의 약자로, 특정 기간 동안 온라인 플랫폼에서 판매된 상품의 총 가치를 의미
  2. 가상 문서 생성(HyDE)
    - 작동 원리: LLM으로 가정 답변 생성 → 해당 문서 임베딩과 실제 문서 유사도 비교
    - 장점: 질문-문서가 아닌 답변-문서 임베딩 유사도 검색으로 정확도 향상
    - 한계: LLM이 주제를 모르는 경우 오답 생성 리스크
  3. 단계적 추상화(Step-back Prompting)
    - 고수준 질문 생성: "AI 윤리 문제 해결 방법" → "AI 윤리의 핵심 원칙은 무엇인가?"
    - 혼합 검색: 원본 질의와 추상화 질문 결과를 병합해 LLM 답변 생성
쿼리 라우팅(Query Routing)
- 목적: 사용자 질의 유형에 따라 최적의 RAG 파이프라인으로 전송해 다양한 시나리오 대응
- 전략: 메타데이터 기반 필터링, 의미적 라우팅, 하이브리드 접근법 결합

D. Embedding

RAG 시스템에서 임베딩 모델의 역할과 선택 기준
1. 검색 메커니즘
  - 유사도 계산: 질문 임베딩과 문서 청크 임베딩 간 코사인 유사도 기반 검색 수행
  - 임베딩 모델 종류
    - 희소 인코더(Sparse Encoder): BM25 등 키워드 가중치 기반
    - 밀집 검색기(Dense Retriever): BERT 계열 사전 학습 모델 사용
2. 최신 임베딩 모델 동향
  - 다중 작업 지시 튜닝(Multi-task Instruct Tuning): AngIE, Voyage, BGE 등이 해당 기법으로 성능 향상
  - 벤치마크:
    - MTEB: 8개 작업/58개 데이터셋으로 전방위 평가
    - C-MTEB: 중국어 특화 평가(6개 작업/35개 데이터셋)
3. 모델 선택 가이드라인
- 범용 모델: MTEB 상위 랭크 모델(예: OpenAI text-embedding-3-large)
- 중국어 특화: C-MTEB에서 검증된 모델(예: BGE)
- 도메인 특화: 의료/법률 등 특정 분야 데이터로 커스텀 평가 필수
혼합 검색(Mix/Hybrid Retrieval)
- 목적: 희소(Sparse)와 밀집(Dense) 임베딩의 상호 보완적 장점 결합해 검색 정확도 향상
- 전략:
  - 초기 검색 결과 제공: 희소 검색 모델로 초기 결과 생성 → 밀집 검색 모델 학습 데이터로 활용
  - 용어 가중치 학습: 사전 학습 언어 모델(PLM)로 용어 중요도 가중치 계산 → 희소 검색 성능 개선
임베딩 모델 미세 조정(Fine-tuning)
- 목적: 사전 학습 코퍼스와 도메인 간 차이(전문 용어, 문맥 구조) 해소를 위한 모델 최적화
- 필요성: 의료·법률 등 전문 분야에서 사전 학습 모델의 용어 이해 한계 보완

리트리버-생성기 정렬을 위한 미세 조정 기법
- 핵심 목적
  - 도메인 지식 보강: 특정 분야(의료/법률 등) 전문 용어 이해력 강화
  - 리트리버-생성기 협업 최적화: 검색 모델과 LLM의 출력 일관성 확보
- 주요 방법론

LSR(LM-Supervised Retriever):
- 작동 원리: LLM의 출력을 감독 신호로 활용해 리트리버 미세 조정
- 장점: 크로스-어텐션 메커니즘 없이 KL 발산(KL Divergence) 기반 학습 가능(REPLUG 사례)
PROMPTAGATOR:
- Few-shot 쿼리 생성: LLM을 이용해 과제 특화 쿼리 생성 → 데이터 부족 분야의 리트리버 훈련
LLM-Embedder:
- 하이브리드 감독 신호:
  - Hard 라벨: 정답 문서 쌍
  - Soft 보상: LLM의 다중 작업 평가 점수
- 효과: 다양한 다운스트림 작업에 대한 임베딩 모델 일반화 능력 향상
RLHF 기반 접근:
- 강화 학습 적용: LLM 피드백으로 리트리버 정책 최적화
- 장점: 노이즈 문서(오검색 결과)에 대한 강건성 강화

E. Adapter

외부 어댑터 활용 미세 조정 기법
- 문제 해결 목적
  - API 통합 한계: 외부 시스템과의 기능 연동 문제
  - 자원 제약: 로컬 컴퓨팅 자원(CPU/GPU) 부족 대응
- 주요 방법론
1. UPRISE:
  - 경량 프롬프트 검색기: 사전 구축된 프롬프트 풀에서 제로샷(zero-shot) 작업에 적합한 프롬프트 자동 추출
  - 적용 효과: 다중 작업 처리 시 별도 미세 조정 없이 최적화
2. AAR(Augmentation-Adapted Retriever):
  - 범용 어댑터: 다중 다운스트림 작업을 수용하는 단일 어댑터 설계
  - 장점: 메모리 효율적이며 도메인 확장성 보유
3. PRCA:
  - 보상 기반 컨텍스트 어댑터: 특정 작업 성능 향상을 위한 플러그형 모듈
  - 작동 원리: 작업별 보상 신호에 따라 동적 어댑터 가중치 조정
4. BGM(Bridge Seq2Seq):
  - 브릿지 모델: 검색 결과 → LLM 호환 형식 변환
  - 기능:
    - 재순위 지정: 관련성 높은 문서 우선 처리
    - 동적 선택: 쿼리별 최적 문서 세트 선별
5. PKG(지식 통합):
  - 지시형 미세 조정: 화이트박스 모델에 지식 직접 주입
  - 리트리버 대체: 쿼리 기반 관련 문서 생성 모듈로 교체

shanny

데이터 분석가

이전 포스트

[논문 리뷰 - 2] Retrieval-Augmented Generation for Large Language Models: A Survey

다음 포스트