[논문 리뷰 - 3] Retrieval-Augmented Generation for Large Language Models: A Survey

shanny·2025년 4월 20일

논문 리뷰

목록 보기
14/42

‼️ 개인 학습 내용으로, 오류가 있을 수 있습니다.

논문 URL - https://arxiv.org/abs/2312.10997

Overview of RAG

  • RAG의 개념과 필요성

    • 기존 ChatGPT 등 대형 언어모델(LLM)은 학습 시점 이후의 최신 정보나 특정 전문 지식이 부족하다는 한계가 있다. 예를 들어, 최근 뉴스와 같이 최신 이슈에 대해 질문하면 답변이 어렵다.
    • RAG(Retrieval-Augmented Generation)는 이러한 한계를 극복하기 위해 외부 데이터베이스(뉴스, 문서 등)에서 관련 정보를 검색하여, 질문과 함께 LLM에 전달함으로써 더 정확하고 최신의 답변을 생성하는 기술이다.
  • RAG의 발전 단계

    • RAG 연구는 크게 세 단계(Naive RAG, Advanced RAG, Modular RAG)로 발전해왔다.
    • 기본 RAG(Naive RAG)는 단순히 질문과 유사한 문서를 검색 후 LLM에 입력해 답변을 생성한다. 비용 효율적이고 성능이 개선되지만, 검색 정확도와 답변 품질, 문맥 통합 등에서 한계가 있다.
    • 고급 RAG(Advanced RAG)는 검색 및 생성 품질을 높이기 위해 검색 전/후 절차, 파이프라인 최적화 등 다양한 기법이 적용된다.
    • 모듈형 RAG(Modular RAG)는 여러 기능을 모듈화해 유연성과 확장성을 높인 최신 패러다임이다. 각각의 한계를 극복하기 위해 발전하고 있다.
  • RAG의 효과와 적용 사례

    • RAG는 LLM의 환각(hallucination) 현상을 줄이고, 최신성·전문성·객관성을 강화할 수 있다.

01. Naive RAG

기본 구조

  • ChatGPT 대중화 직후 주목받은 초기 방법론으로, 인덱싱·검색·생성(Retrieve-Read)의 전통적 3단계 프레임워크를 따른다.

  • 이는 외부 데이터베이스에서 문서를 검색해 LLM이 읽고 답변을 생성하는 기본 구조를 가진다.

  • Indexing

    • PDF, HTML, Word, Markdown 등 다양한 형식의 원본 데이터를 정제 및 추출해 일반 텍스트로 변환한다.
    • 이후 언어 모델의 문맥 제약을 고려해 텍스트를 작은 조각으로 분할하고, 임베딩 모델을 통해 벡터 표현으로 변환한 후 벡터 데이터베이스에 저장한다.
    • 이 과정은 후속 검색 단계에서 효율적인 유사도 검색을 가능하게 하는 핵심 단계다.
  • Retrieval

    • RAG 시스템은 사용자의 쿼리를 인덱싱 단계와 동일한 임베딩 모델로 벡터화한 후, 인덱스된 텍스트 조각(Chunk)들과의 유사도를 계산해 상위 K개를 선별한다.
    • 이렇게 검색된 조각들은 확장된 문맥으로 활용되어 프롬프트에 통합된다.
  • Generation

    • RAG 시스템은 사용자 질의와 검색된 문서를 결합해 일관된 프롬프트를 생성하며, LLM은 이를 바탕으로 답변을 작성한다.
    • 이때 모델은 사전 학습된 지식 또는 제공된 문서에 한정된 정보를 활용할 수 있으며, 대화 기록이 포함된 경우 이를 프롬프트에 통합해 다중 회차 상호작용이 가능하다.

직면한 문제

  • Retrieval Challenges

    • 검색 단계는 정밀도와 재현율 문제로 인해 관련 없는 조각을 선택하거나 핵심 정보를 놓치는 한계가 있다.
  • Generation Difficulties

    • 생성 단계에서는 검색된 문맥과 무관한 환각(hallucination) 현상이 발생할 수 있으며, 무관성·유해성·편향성 문제로 답변의 품질과 신뢰성이 저해된다.
  • Augmentation Hurdles
    • 검색 정보와 다양한 작업의 통합 과정에서 발생하는 문제를 의미한다.
    • 검색된 정보의 불일치로 인해 결렬되거나 일관성 없는 출력이 생성될 수 있으며, 다중 출처에서 유사 정보가 중복 검색될 경우 반복적 응답 문제가 발생한다.
    • 각 문단의 중요도·관련성 판단과 문체·어조 일관성 유지도 복잡성을 가중시킨다.
    • 단일 검색으로는 충분한 맥락 확보가 어려운 경우가 많으며, 생성 모델이 검색 내용에 과도하게 의존해 통찰력이나 종합적 분석 없이 단순 반복하는 결과를 초래할 위험도 존재한다.

02. Advanced RAG

특징

  • Naive RAG의 한계를 극복하기 위해 검색 품질 향상에 집중한다.

  • 사전 검색(전처리) 및 사후 검색 전략을 도입하고, 인덱싱 기법을 슬라이딩 윈도우, 세분화된 분할, 메타데이터 통합 등을 통해 개선한다.

  • 또한 검색 프로세스 최적화를 통해 효율성을 높인다.

  • 사전 검색 과정(검색 품질 향상)

    • 인덱싱 최적화 : 데이터 세분화 강화, 인덱스 구조 개선, 메타데이터 추가, 정렬 최적화, 혼합 검색(밀집/희소 검색 병행)을 통해 검색 대상 콘텐츠의 품질을 향상시킨다.
    • 질의(쿼리) 최적화: 질의 재구성(rewriting), 변환(transformation), 확장(expansion) 등 기법으로 원본 질의를 명확하게 개선해 검색 적합도를 높인다
  • 사후 검색 과정(검색된 문맥을 효과적으로 통합)

    • 재순위화(rerank) : LlamaIndex, LangChain, HayStack 등의 프레임워크에서 검색된 청크의 관련성 점수를 재평가해 프롬프트의 시작/끝 부분에 핵심 내용을 배치함으로써 LLM의 주의 집중도를 높인다.
      • 이 컨셉을 사용한 사례 - LlamaIndex, LangChain, HayStack
    • 문맥 압축(context compressing) : 불필요한 정보를 제거하거나 핵심 문장을 추출해 LLM이 처리할 문맥 길이를 단축함으로써 정보 과부하 및 관련성 저하 문제를 해결한다

03. Modular RAG

특징

  • 모듈형 RAG는 기존 RAG 패러다임(Naive, Advanced)을 발전시켜 유연성과 적응성을 강화한 아키텍처다.
  • 검색 모듈 추가, 리트리버 미세 조정(fine-tuning), 모듈 재구성 및 파이프라인 재배치 등 다양한 전략을 통해 개별 컴포넌트를 최적화한다.
  • 순차 처리와 종단간 통합 학습(end-to-end)을 모두 지원하며, 모듈 교체·확장을 통해 특정 과제에 맞춤화된 설계가 가능하다.
  • 핵심 원칙은 기존 RAG와 동일하지만, 모듈화를 통해 성능과 확장성을 혁신적으로 개선했다.

1. 새로운 모듈

모듈형 RAG는 전문화된 추가 모듈을 도입해 검색 및 처리 역량을 강화한다.
(검색 프로세스 효율화와 정보의 정확성·유연성을 동시에 확보)

  • 검색 모듈: LLM 생성 코드/쿼리 언어를 활용해 검색엔진·DB·지식그래프 등 다양한 데이터 소스 직접 탐색
  • RAG-Fusion: 다중 쿼리 전략으로 사용자 질의를 확장하고, 병렬 벡터 검색·재순위화를 통해 명시적·변형적 지식을 포착
  • 메모리 모듈: LLM 메모리를 활용해 무제한 메모리 풀 구축 및 데이터 분포 맞춤형 검색 유도
  • 라우팅: 질의 유형(요약·특정 DB 검색·정보 통합 등)에 최적 경로 선택
  • 예측 모듈: LLM이 직접 문맥을 생성해 잡음·중복 제거
  • 태스크 어댑터: 제로샷 입력 시 자동 프롬프트 검색, 퓨샷 쿼리 생성으로 작업별 맞춤형 리트리버 구현

2. 새로운 패턴

모듈형 RAG는 모듈 교체/재구성을 통해 기존 RAG의 고정된 구조("검색-읽기" 메커니즘)를 넘어 유연성을 극대화한다.
새로운 모듈 통합 및 기존 모듈 간 상호작용 흐름 조정을 통해 다양한 작업에 적용 범위를 확장한다.

  • Rewrite-Retrieve-Read : LLM 기반 쿼리 재작성 모듈과 피드백 메커니즘으로 검색 질의 최적화
  • Generate-Read : 전통적 검색 대신 LLM이 직접 콘텐츠 생성
  • Recite-Read : 모델 가중치 내부 지식을 검색해 지식 집약적 작업 처리 강화
  • 하이브리드 검색 : 키워드·의미·벡터 검색 통합
  • Hypothetical document embeddings(HyDE) : 생성된 답변과 실제 문서 간 임베딩 유사도 활용해 검색 관련성 향상

모듈형 RAG는 모듈 간 동적 조정·협업 전략을 통해 고도화된 유연성을 구현한다.

  • DSP(Demonstrate-Search-Predict)와 ITER-RETGEN(iterative Retrieve-Read-Retrieve-Read)은 모듈 출력을 상호 연계해 검색-생성 시너지를 극대화한다.
  • FLARE와 Self-RAG는 적응형 검색 기법으로 시나리오 기반 필요성 판단 후 동적 정보 수집이 가능하다.
  • 외부 기술 통합: 미세 조정(Fine-tuning)·강화학습(Reinforcement Learning)과 결합해 리트리버 성능 개선 및 생성 모델의 개인화 출력을 구현한다.

04. RAG vs. Fine-tuning

LLM 최적화 기법으로 RAG, 파인튜닝(FT), 프롬프트 엔지니어링이 차별적 특성을 보인다.

  • 프롬프트 엔지니어링: 모델의 내재적 역량을 활용하며 외부 지식/모델 수정 필요성 최소화

  • RAG: 외부 데이터베이스를 "맞춤 교과서"처럼 활용해 정밀 정보 검색에 특화

    • 장점: 실시간 지식 업데이트 가능, 외부 지식원 활용 및 해석 용이성 우수

    • 단점: 처리 지연 시간(latency)이 오래 걸림, 데이터 검색 관련 윤리적 문제 발생 가능성

  • Fine-Tuning(FT): 특정 스타일·구조 재현에 적합하며, 지식을 모델 내부에 체화하는 방식

    • 장점: 모델 행동·스타일 심층 커스터마이징 가능, 환각(hallucination) 현상 감소

    • 단점: 업데이트 시 재학습 필요, 데이터셋 준비·학습에 고성능 컴퓨팅 자원 요구, 비익숙 데이터 처리 한계

      구분외부 지식 요구도모델 적응 요구도
      프롬프트 엔지니어링낮음낮음
      RAG높음중간
      Fine-Tuning중간높음
  • 성능 비교

    • RAG : 비지도 미세 조정(unsupervised FT)보다 기존 및 새로운 지식 기반 작업에서 일관되게 우수한 성능을 보인다.
    • LLM : 비지도 미세 조정으로 새로운 사실 정보를 습득하는 데 어려움을 겪는다.
  • 선택 기준

    • RAG : 동적 데이터 환경·실시간 정보 업데이트 필요 시 적합
    • Fine-Tuning : 특정 도메인 전문성·스타일 맞춤화 요구 시 유리
  • 상호 보완

    • RAG와 FT 병행 사용 시 모델 성능 극대화 가능
    • 최적화를 위해 다중 반복 프로세스가 필요

Retrieval

A. Retrieval source

RAG 시스템에서 문서 검색 효율성은 외부 지식원 유형, 검색 단위 세분화, 전처리, 임베딩 모델 선택 등에 의해 결정된다.

검색 소스

  • 데이터 구조
    • Unstructured Data
      • 비정형 데이터는 주로 코퍼스(corpus)에서 수집된 텍스트 형태로 가장 널리 사용되는 검색 소스다.
        • 개방형 질의응답(ODQA): 위키피디아 덤프(HotpotQA 4, DPR5)가 주요 검색 소스로 활용된다.
        • 다국어 텍스트: cross-lingual 데이터 및 의료·법률 도메인 특화 자료가 추가 소스로 사용된다.
    • Semi-structured Data
      • 반구조화 데이터(텍스트와 테이블이 혼합된 PDF 등) 처리는 기존 RAG 시스템에 두 가지 주요 도전 과제를 제기한다.
        1. 텍스트 분할 문제: 테이블 구조가 분할 과정에서 손상되어 데이터 무결성이 훼손된다.
        2. 의미적 검색 복잡성: 테이블 포함 시 벡터 검색 정확도가 저하된다.
      • 현존 접근법
        • Text-2-SQL: LLM의 코드 생성 능력을 활용해 데이터베이스 내 테이블 직접 쿼리
        • 테이블 텍스트 변환: 테이블을 자연어 형식으로 변환 후 처리
        • 한계: 두 방법 모두 최적화되지 않아 연구 개선 여지가 크다.
    • Structured Data
      • 구조화된 데이터는 RAG 시스템에서 정확한 정보 검색과 품질 향상을 위해 핵심적으로 활용되며, 특히 지식그래프(KG)와 같은 검증된 구조가 주로 사용된다.
        • 주요 기술 및 장점
          1. KnowledGPT: 지식베이스(KB) 검색 쿼리 생성 및 개인화된 지식 저장을 통해 RAG의 지식 풍부성 강화
          2. G-Retriever: 그래프 신경망(GNN)·LLM·RAG 통합으로 텍스트 그래프 이해 및 질의응답 능력 향상
          3. PCST(Prize-Collecting Steiner Tree) 최적화 기법을 활용한 타겟형 그래프 검색 구현
          4. GNN-RAG: KGQA 작업에서 GPT-4 성능을 능가하는 다중 홉·다중 엔터티 질문 처리 능력
        • 도전 과제(구조화 데이터 관리)
          • 검증·유지보수를 위한 추가 리소스 필요
          • 도메인 특화 지식그래프 구축의 높은 초기 비용
    • LLMs-Generated Content
      • LLM 생성 콘텐츠 활용 연구는 RAG의 외부 정보 의존 한계를 극복하기 위해 LLM의 내부 지식을 적극적으로 활용한다.
        • SKR: 질문을 "알려진 것"과 "알려지지 않은 것"으로 분류해 검색 강화를 선택적으로 적용
        • GenRead : 검색기 대신 LLM 생성기를 사용해 사전 학습 목표와 일관된 정확한 문맥 생성
        • Selfmem : 무한 메모리 풀을 구축하고 이중 문제 생성 기반으로 생성 모델을 점진적 개선

검색 세분성

  • 검색 단위 세분화는 RAG 시스템 성능에 중요한 영향을 미친다.
    • 거친 단위(coarse-grained): 관련 정보 포함량은 많지만 잡음(불필요한 내용) 증가 가능성 있음
    • 세밀한 단위(fine-grained): 정밀도 향상 가능성 있으나 검색 부담 증가 및 의미적 무결성 저해
  • 검색 세분화 단위는 텍스트와 지식그래프(KG) 영역에서 다양한 수준으로 구분되며, 하류 작업에 맞춰 적응적으로 적용된다.
    • 텍스트 기반 검색 세분화
      • 세밀한 단위: 토큰·구(Phrase)·문장·명제(Proposition)·청크
      • 명제(Proposition): 단일 사실을 포함한 원자적 표현으로, DenseX1에서 제안된 고정밀 검색 단위
      • 거친 단위: 문서(Document) 수준
    • 지식그래프(KG) 기반 검색 세분화
      • 엔티티(Entity): 개별 개념 단위
      • 트리플렛(Triplet): (주체-관계-객체) 3요소 구조
      • 서브그래프(Sub-Graph): 관련 노드·엣지 집합
    • downstream 작업 맞춤형 세분화
      • 추천 시스템: 아이템 ID 기반 검색
      • 기계 번역: 문장 쌍(Sentence Pair) 단위 검색

B. Indexing Optimization

  • RAG 인덱싱 단계에서 문서 처리 및 청킹 전략은 검색 정확도와 효율성을 결정한다.

  • 청킹 전략 핵심 요소

    • 고정 토큰 분할: 100/256/512 토큰 단위 분할이 일반적
    • 장점: 구현 간편성
    • 단점: 문맥 단절 가능성
    • 재귀 분할/슬라이딩 윈도우: 계층적 검색을 통해 전역적 문맥 정보 통합
    • Small2Big:
      • 소형(Small): 문장 단위 검색
      • 대형(Big): 인접 문장을 포함한 확장 컨텍스트 제공
  • 메타데이터 활용은 RAG 시스템의 검색 정확도와 컨텍스트 적합성을 개선하는 핵심 전략이다.

  • 메타데이터 부착 전략

    • 기본 메타데이터: 페이지 번호, 파일명, 작성자, 카테고리, 타임스탬프 등을 청크에 추가
    • 시간 인식 검색: 문서 타임스탬프에 가중치 부여해 최신 정보 우선 검색
    • 인공 메타데이터 생성:
      • 문단 요약: LLM을 활용해 청크 내용을 요약한 메타데이터 추가
      • 가설 질문 생성(Reverse HyDE): 문서에서 답변 가능한 질문을 LLM으로 생성 후, 원본 질의와의 유사도 계산
  • 계층적 구조 인덱스(Structural Index) 구축은 문서 간 관계를 체계화해 RAG 시스템의 검색 속도와 데이터 처리 효율성을 향상시키는 핵심 전략이다.

    • 계층적 인덱스 구조 : 부모-자식 관계로 문서를 조직화하고, 각 노드에 데이터 요약을 저장해 신속한 탐색을 지원한다.
    • 지식 그래프 인덱스 : 문서 계층 구조 구축 시 개념·엔터티 간 관계를 명확히 정의해 RAG 시스템의 일관성과 정확도를 향상시킨다.
      • 주요 기능 :
        • 의미적 관계 명시화: 문서 내 문단·표·페이지 노드 간 유사도/구조적 관계를 엣지로 연결
        • 다중 문서 통합: KGP1 프레임워크는 KG를 통해 문서 간 지식 검색·추론 문제 해결

C. Query Optimization

  • Naive RAG의 주요 문제점

    • 질의 의존성: 사용자 원문 질의를 그대로 검색에 사용해 부정확한 결과 초래
    • 모호한 약어 처리: "LLM"과 같은 전문 용어의 다중 의미 구분 실패(예: 대규모 언어 모델(Large Language Model) vs 법학 석사(Master of Laws))
    • 언어 복잡성: 전문 용어·구조화되지 않은 질문 처리 능력 부족
  • 쿼리 확장 및 검증 기법

  1. 쿼리 확장(Query Expansion)
    • 목적: 단일 질의를 다중 질의로 확장해 문맥적 뉘앙스 보강 및 답변 관련성 극대화
    • 방식:
      • Multi-Query: LLM을 활용해 질의를 병렬 처리 가능한 다중 하위 질문으로 변환
      • Sub-Query : 복잡 질문을 단순 하위 질문으로 분해(예: Least-to-Most 프롬프팅)
  2. 검증 체인(Chain-of-Verification, CoVe)
    • 목적: 확장된 쿼리의 할루시네이션(hallucination) 감소 및 신뢰도 향상
  • 쿼리 변환(Query Transformation)
    • 목적: 사용자 원본 질의를 변환해 검색 정확도 및 LLM 응답 품질 향상
    • 전략: 질의 재작성, 가상 문서 생성, 추상화 질문 생성 등을 활용
    • 주요 방법
      1. 질의 재작성(Query Rewrite)
        • LLM 활용: 원본 질의를 최적화된 형태로 재구성(예: "최신 스마트폰 비교" → "2024년 삼성/애플 플래그십 스마트폰 기능 비교")
        • 전용 모델(RRR): 검색 효율성 개선을 위한 소규모 언어 모델 적용
        • BEQUE 사례: 타오바오에서 long-tail 질의 검색 재현율 향상 및 GMV 증가 달성
          * Gross Merchandise Volume(총 상품 거래액)의 약자로, 특정 기간 동안 온라인 플랫폼에서 판매된 상품의 총 가치를 의미
      2. 가상 문서 생성(HyDE)
        • 작동 원리: LLM으로 가정 답변 생성 → 해당 문서 임베딩과 실제 문서 유사도 비교
        • 장점: 질문-문서가 아닌 답변-문서 임베딩 유사도 검색으로 정확도 향상
        • 한계: LLM이 주제를 모르는 경우 오답 생성 리스크
      3. 단계적 추상화(Step-back Prompting)
        • 고수준 질문 생성: "AI 윤리 문제 해결 방법" → "AI 윤리의 핵심 원칙은 무엇인가?"
        • 혼합 검색: 원본 질의와 추상화 질문 결과를 병합해 LLM 답변 생성
  • 쿼리 라우팅(Query Routing)
    • 목적: 사용자 질의 유형에 따라 최적의 RAG 파이프라인으로 전송해 다양한 시나리오 대응
    • 전략: 메타데이터 기반 필터링, 의미적 라우팅, 하이브리드 접근법 결합

D. Embedding

  • RAG 시스템에서 임베딩 모델의 역할과 선택 기준

    1. 검색 메커니즘

      • 유사도 계산: 질문 임베딩과 문서 청크 임베딩 간 코사인 유사도 기반 검색 수행
      • 임베딩 모델 종류
        • 희소 인코더(Sparse Encoder): BM25 등 키워드 가중치 기반
        • 밀집 검색기(Dense Retriever): BERT 계열 사전 학습 모델 사용
    2. 최신 임베딩 모델 동향

      • 다중 작업 지시 튜닝(Multi-task Instruct Tuning): AngIE, Voyage, BGE 등이 해당 기법으로 성능 향상
      • 벤치마크:
        • MTEB: 8개 작업/58개 데이터셋으로 전방위 평가
        • C-MTEB: 중국어 특화 평가(6개 작업/35개 데이터셋)
    3. 모델 선택 가이드라인

    • 범용 모델: MTEB 상위 랭크 모델(예: OpenAI text-embedding-3-large)
    • 중국어 특화: C-MTEB에서 검증된 모델(예: BGE)
    • 도메인 특화: 의료/법률 등 특정 분야 데이터로 커스텀 평가 필수
  • 혼합 검색(Mix/Hybrid Retrieval)

    • 목적: 희소(Sparse)와 밀집(Dense) 임베딩의 상호 보완적 장점 결합해 검색 정확도 향상
    • 전략:
      • 초기 검색 결과 제공: 희소 검색 모델로 초기 결과 생성 → 밀집 검색 모델 학습 데이터로 활용
      • 용어 가중치 학습: 사전 학습 언어 모델(PLM)로 용어 중요도 가중치 계산 → 희소 검색 성능 개선
  • 임베딩 모델 미세 조정(Fine-tuning)

    • 목적: 사전 학습 코퍼스와 도메인 간 차이(전문 용어, 문맥 구조) 해소를 위한 모델 최적화
    • 필요성: 의료·법률 등 전문 분야에서 사전 학습 모델의 용어 이해 한계 보완
  • 리트리버-생성기 정렬을 위한 미세 조정 기법
    • 핵심 목적
      • 도메인 지식 보강: 특정 분야(의료/법률 등) 전문 용어 이해력 강화
      • 리트리버-생성기 협업 최적화: 검색 모델과 LLM의 출력 일관성 확보
    • 주요 방법론
  1. LSR(LM-Supervised Retriever):

    • 작동 원리: LLM의 출력을 감독 신호로 활용해 리트리버 미세 조정
    • 장점: 크로스-어텐션 메커니즘 없이 KL 발산(KL Divergence) 기반 학습 가능(REPLUG 사례)
  2. PROMPTAGATOR:

    • Few-shot 쿼리 생성: LLM을 이용해 과제 특화 쿼리 생성 → 데이터 부족 분야의 리트리버 훈련
  3. LLM-Embedder:

    • 하이브리드 감독 신호:
      • Hard 라벨: 정답 문서 쌍
      • Soft 보상: LLM의 다중 작업 평가 점수
    • 효과: 다양한 다운스트림 작업에 대한 임베딩 모델 일반화 능력 향상
  4. RLHF 기반 접근:

    • 강화 학습 적용: LLM 피드백으로 리트리버 정책 최적화
    • 장점: 노이즈 문서(오검색 결과)에 대한 강건성 강화

E. Adapter

  • 외부 어댑터 활용 미세 조정 기법

    • 문제 해결 목적
      • API 통합 한계: 외부 시스템과의 기능 연동 문제
      • 자원 제약: 로컬 컴퓨팅 자원(CPU/GPU) 부족 대응
    • 주요 방법론
    1. UPRISE:

      • 경량 프롬프트 검색기: 사전 구축된 프롬프트 풀에서 제로샷(zero-shot) 작업에 적합한 프롬프트 자동 추출
      • 적용 효과: 다중 작업 처리 시 별도 미세 조정 없이 최적화
    2. AAR(Augmentation-Adapted Retriever):

      • 범용 어댑터: 다중 다운스트림 작업을 수용하는 단일 어댑터 설계
      • 장점: 메모리 효율적이며 도메인 확장성 보유
    3. PRCA:

      • 보상 기반 컨텍스트 어댑터: 특정 작업 성능 향상을 위한 플러그형 모듈
      • 작동 원리: 작업별 보상 신호에 따라 동적 어댑터 가중치 조정
    4. BGM(Bridge Seq2Seq):

      • 브릿지 모델: 검색 결과 → LLM 호환 형식 변환

      • 기능:

        • 재순위 지정: 관련성 높은 문서 우선 처리
        • 동적 선택: 쿼리별 최적 문서 세트 선별
    5. PKG(지식 통합):

      • 지시형 미세 조정: 화이트박스 모델에 지식 직접 주입
      • 리트리버 대체: 쿼리 기반 관련 문서 생성 모듈로 교체
profile
데이터 분석가

0개의 댓글