‼️ 개인 학습 내용으로, 오류가 있을 수 있습니다.
논문 URL - https://arxiv.org/abs/2312.10997
Overview of RAG
-
RAG의 개념과 필요성
- 기존 ChatGPT 등 대형 언어모델(LLM)은 학습 시점 이후의 최신 정보나 특정 전문 지식이 부족하다는 한계가 있다. 예를 들어, 최근 뉴스와 같이 최신 이슈에 대해 질문하면 답변이 어렵다.
- RAG(Retrieval-Augmented Generation)는 이러한 한계를 극복하기 위해 외부 데이터베이스(뉴스, 문서 등)에서 관련 정보를 검색하여, 질문과 함께 LLM에 전달함으로써 더 정확하고 최신의 답변을 생성하는 기술이다.
-
RAG의 발전 단계
- RAG 연구는 크게 세 단계(Naive RAG, Advanced RAG, Modular RAG)로 발전해왔다.
- 기본 RAG(Naive RAG)는 단순히 질문과 유사한 문서를 검색 후 LLM에 입력해 답변을 생성한다. 비용 효율적이고 성능이 개선되지만, 검색 정확도와 답변 품질, 문맥 통합 등에서 한계가 있다.
- 고급 RAG(Advanced RAG)는 검색 및 생성 품질을 높이기 위해 검색 전/후 절차, 파이프라인 최적화 등 다양한 기법이 적용된다.
- 모듈형 RAG(Modular RAG)는 여러 기능을 모듈화해 유연성과 확장성을 높인 최신 패러다임이다. 각각의 한계를 극복하기 위해 발전하고 있다.
-
RAG의 효과와 적용 사례
- RAG는 LLM의 환각(hallucination) 현상을 줄이고, 최신성·전문성·객관성을 강화할 수 있다.
01. Naive RAG
기본 구조
-
ChatGPT 대중화 직후 주목받은 초기 방법론으로, 인덱싱·검색·생성(Retrieve-Read)의 전통적 3단계 프레임워크를 따른다.
-
이는 외부 데이터베이스에서 문서를 검색해 LLM이 읽고 답변을 생성하는 기본 구조를 가진다.
-
Indexing
- PDF, HTML, Word, Markdown 등 다양한 형식의 원본 데이터를 정제 및 추출해 일반 텍스트로 변환한다.
- 이후 언어 모델의 문맥 제약을 고려해 텍스트를 작은 조각으로 분할하고, 임베딩 모델을 통해 벡터 표현으로 변환한 후 벡터 데이터베이스에 저장한다.
- 이 과정은 후속 검색 단계에서 효율적인 유사도 검색을 가능하게 하는 핵심 단계다.
-
Retrieval
- RAG 시스템은 사용자의 쿼리를 인덱싱 단계와 동일한 임베딩 모델로 벡터화한 후, 인덱스된 텍스트 조각(Chunk)들과의 유사도를 계산해 상위 K개를 선별한다.
- 이렇게 검색된 조각들은 확장된 문맥으로 활용되어 프롬프트에 통합된다.
-
Generation
- RAG 시스템은 사용자 질의와 검색된 문서를 결합해 일관된 프롬프트를 생성하며, LLM은 이를 바탕으로 답변을 작성한다.
- 이때 모델은 사전 학습된 지식 또는 제공된 문서에 한정된 정보를 활용할 수 있으며, 대화 기록이 포함된 경우 이를 프롬프트에 통합해 다중 회차 상호작용이 가능하다.
직면한 문제
-
Retrieval Challenges
- 검색 단계는 정밀도와 재현율 문제로 인해 관련 없는 조각을 선택하거나 핵심 정보를 놓치는 한계가 있다.
-
Generation Difficulties
- 생성 단계에서는 검색된 문맥과 무관한 환각(hallucination) 현상이 발생할 수 있으며, 무관성·유해성·편향성 문제로 답변의 품질과 신뢰성이 저해된다.
- Augmentation Hurdles
- 검색 정보와 다양한 작업의 통합 과정에서 발생하는 문제를 의미한다.
- 검색된 정보의 불일치로 인해 결렬되거나 일관성 없는 출력이 생성될 수 있으며, 다중 출처에서 유사 정보가 중복 검색될 경우 반복적 응답 문제가 발생한다.
- 각 문단의 중요도·관련성 판단과 문체·어조 일관성 유지도 복잡성을 가중시킨다.
- 단일 검색으로는 충분한 맥락 확보가 어려운 경우가 많으며, 생성 모델이 검색 내용에 과도하게 의존해 통찰력이나 종합적 분석 없이 단순 반복하는 결과를 초래할 위험도 존재한다.
02. Advanced RAG
특징
-
Naive RAG의 한계를 극복하기 위해 검색 품질 향상에 집중한다.
-
사전 검색(전처리) 및 사후 검색 전략을 도입하고, 인덱싱 기법을 슬라이딩 윈도우, 세분화된 분할, 메타데이터 통합 등을 통해 개선한다.
-
또한 검색 프로세스 최적화를 통해 효율성을 높인다.
-
사전 검색 과정(검색 품질 향상)
- 인덱싱 최적화 : 데이터 세분화 강화, 인덱스 구조 개선, 메타데이터 추가, 정렬 최적화, 혼합 검색(밀집/희소 검색 병행)을 통해 검색 대상 콘텐츠의 품질을 향상시킨다.
- 질의(쿼리) 최적화: 질의 재구성(rewriting), 변환(transformation), 확장(expansion) 등 기법으로 원본 질의를 명확하게 개선해 검색 적합도를 높인다
-
사후 검색 과정(검색된 문맥을 효과적으로 통합)
- 재순위화(rerank) : LlamaIndex, LangChain, HayStack 등의 프레임워크에서 검색된 청크의 관련성 점수를 재평가해 프롬프트의 시작/끝 부분에 핵심 내용을 배치함으로써 LLM의 주의 집중도를 높인다.
- 이 컨셉을 사용한 사례 - LlamaIndex, LangChain, HayStack
- 문맥 압축(context compressing) : 불필요한 정보를 제거하거나 핵심 문장을 추출해 LLM이 처리할 문맥 길이를 단축함으로써 정보 과부하 및 관련성 저하 문제를 해결한다
03. Modular RAG
특징
- 모듈형 RAG는 기존 RAG 패러다임(Naive, Advanced)을 발전시켜 유연성과 적응성을 강화한 아키텍처다.
- 검색 모듈 추가, 리트리버 미세 조정(fine-tuning), 모듈 재구성 및 파이프라인 재배치 등 다양한 전략을 통해 개별 컴포넌트를 최적화한다.
- 순차 처리와 종단간 통합 학습(end-to-end)을 모두 지원하며, 모듈 교체·확장을 통해 특정 과제에 맞춤화된 설계가 가능하다.
- 핵심 원칙은 기존 RAG와 동일하지만, 모듈화를 통해 성능과 확장성을 혁신적으로 개선했다.
1. 새로운 모듈
모듈형 RAG는 전문화된 추가 모듈을 도입해 검색 및 처리 역량을 강화한다.
(검색 프로세스 효율화와 정보의 정확성·유연성을 동시에 확보)
- 검색 모듈: LLM 생성 코드/쿼리 언어를 활용해 검색엔진·DB·지식그래프 등 다양한 데이터 소스 직접 탐색
- RAG-Fusion: 다중 쿼리 전략으로 사용자 질의를 확장하고, 병렬 벡터 검색·재순위화를 통해 명시적·변형적 지식을 포착
- 메모리 모듈: LLM 메모리를 활용해 무제한 메모리 풀 구축 및 데이터 분포 맞춤형 검색 유도
- 라우팅: 질의 유형(요약·특정 DB 검색·정보 통합 등)에 최적 경로 선택
- 예측 모듈: LLM이 직접 문맥을 생성해 잡음·중복 제거
- 태스크 어댑터: 제로샷 입력 시 자동 프롬프트 검색, 퓨샷 쿼리 생성으로 작업별 맞춤형 리트리버 구현
2. 새로운 패턴
모듈형 RAG는 모듈 교체/재구성을 통해 기존 RAG의 고정된 구조("검색-읽기" 메커니즘)를 넘어 유연성을 극대화한다.
새로운 모듈 통합 및 기존 모듈 간 상호작용 흐름 조정을 통해 다양한 작업에 적용 범위를 확장한다.
- Rewrite-Retrieve-Read : LLM 기반 쿼리 재작성 모듈과 피드백 메커니즘으로 검색 질의 최적화
- Generate-Read : 전통적 검색 대신 LLM이 직접 콘텐츠 생성
- Recite-Read : 모델 가중치 내부 지식을 검색해 지식 집약적 작업 처리 강화
- 하이브리드 검색 : 키워드·의미·벡터 검색 통합
- Hypothetical document embeddings(HyDE) : 생성된 답변과 실제 문서 간 임베딩 유사도 활용해 검색 관련성 향상
모듈형 RAG는 모듈 간 동적 조정·협업 전략을 통해 고도화된 유연성을 구현한다.
- DSP(Demonstrate-Search-Predict)와 ITER-RETGEN(iterative Retrieve-Read-Retrieve-Read)은 모듈 출력을 상호 연계해 검색-생성 시너지를 극대화한다.
- FLARE와 Self-RAG는 적응형 검색 기법으로 시나리오 기반 필요성 판단 후 동적 정보 수집이 가능하다.
- 외부 기술 통합: 미세 조정(Fine-tuning)·강화학습(Reinforcement Learning)과 결합해 리트리버 성능 개선 및 생성 모델의 개인화 출력을 구현한다.
04. RAG vs. Fine-tuning
LLM 최적화 기법으로 RAG, 파인튜닝(FT), 프롬프트 엔지니어링이 차별적 특성을 보인다.
-
프롬프트 엔지니어링: 모델의 내재적 역량을 활용하며 외부 지식/모델 수정 필요성 최소화
-
RAG: 외부 데이터베이스를 "맞춤 교과서"처럼 활용해 정밀 정보 검색에 특화
-
장점: 실시간 지식 업데이트 가능, 외부 지식원 활용 및 해석 용이성 우수
-
단점: 처리 지연 시간(latency)이 오래 걸림, 데이터 검색 관련 윤리적 문제 발생 가능성
-
Fine-Tuning(FT): 특정 스타일·구조 재현에 적합하며, 지식을 모델 내부에 체화하는 방식
-
장점: 모델 행동·스타일 심층 커스터마이징 가능, 환각(hallucination) 현상 감소
-
단점: 업데이트 시 재학습 필요, 데이터셋 준비·학습에 고성능 컴퓨팅 자원 요구, 비익숙 데이터 처리 한계
| 구분 | 외부 지식 요구도 | 모델 적응 요구도 |
|---|
| 프롬프트 엔지니어링 | 낮음 | 낮음 |
| RAG | 높음 | 중간 |
| Fine-Tuning | 중간 | 높음 |
-
성능 비교
- RAG : 비지도 미세 조정(unsupervised FT)보다 기존 및 새로운 지식 기반 작업에서 일관되게 우수한 성능을 보인다.
- LLM : 비지도 미세 조정으로 새로운 사실 정보를 습득하는 데 어려움을 겪는다.
-
선택 기준
- RAG : 동적 데이터 환경·실시간 정보 업데이트 필요 시 적합
- Fine-Tuning : 특정 도메인 전문성·스타일 맞춤화 요구 시 유리
-
상호 보완
- RAG와 FT 병행 사용 시 모델 성능 극대화 가능
- 최적화를 위해 다중 반복 프로세스가 필요
Retrieval
A. Retrieval source
RAG 시스템에서 문서 검색 효율성은 외부 지식원 유형, 검색 단위 세분화, 전처리, 임베딩 모델 선택 등에 의해 결정된다.
검색 소스
- 데이터 구조
- Unstructured Data
- 비정형 데이터는 주로 코퍼스(corpus)에서 수집된 텍스트 형태로 가장 널리 사용되는 검색 소스다.
- 개방형 질의응답(ODQA): 위키피디아 덤프(HotpotQA 4, DPR5)가 주요 검색 소스로 활용된다.
- 다국어 텍스트: cross-lingual 데이터 및 의료·법률 도메인 특화 자료가 추가 소스로 사용된다.
- Semi-structured Data
- 반구조화 데이터(텍스트와 테이블이 혼합된 PDF 등) 처리는 기존 RAG 시스템에 두 가지 주요 도전 과제를 제기한다.
- 텍스트 분할 문제: 테이블 구조가 분할 과정에서 손상되어 데이터 무결성이 훼손된다.
- 의미적 검색 복잡성: 테이블 포함 시 벡터 검색 정확도가 저하된다.
- 현존 접근법
- Text-2-SQL: LLM의 코드 생성 능력을 활용해 데이터베이스 내 테이블 직접 쿼리
- 테이블 텍스트 변환: 테이블을 자연어 형식으로 변환 후 처리
- 한계: 두 방법 모두 최적화되지 않아 연구 개선 여지가 크다.
- Structured Data
- 구조화된 데이터는 RAG 시스템에서 정확한 정보 검색과 품질 향상을 위해 핵심적으로 활용되며, 특히 지식그래프(KG)와 같은 검증된 구조가 주로 사용된다.
- 주요 기술 및 장점
- KnowledGPT: 지식베이스(KB) 검색 쿼리 생성 및 개인화된 지식 저장을 통해 RAG의 지식 풍부성 강화
- G-Retriever: 그래프 신경망(GNN)·LLM·RAG 통합으로 텍스트 그래프 이해 및 질의응답 능력 향상
- PCST(Prize-Collecting Steiner Tree) 최적화 기법을 활용한 타겟형 그래프 검색 구현
- GNN-RAG: KGQA 작업에서 GPT-4 성능을 능가하는 다중 홉·다중 엔터티 질문 처리 능력
- 도전 과제(구조화 데이터 관리)
- 검증·유지보수를 위한 추가 리소스 필요
- 도메인 특화 지식그래프 구축의 높은 초기 비용
- LLMs-Generated Content
- LLM 생성 콘텐츠 활용 연구는 RAG의 외부 정보 의존 한계를 극복하기 위해 LLM의 내부 지식을 적극적으로 활용한다.
- SKR: 질문을 "알려진 것"과 "알려지지 않은 것"으로 분류해 검색 강화를 선택적으로 적용
- GenRead : 검색기 대신 LLM 생성기를 사용해 사전 학습 목표와 일관된 정확한 문맥 생성
- Selfmem : 무한 메모리 풀을 구축하고 이중 문제 생성 기반으로 생성 모델을 점진적 개선
검색 세분성
- 검색 단위 세분화는 RAG 시스템 성능에 중요한 영향을 미친다.
- 거친 단위(coarse-grained): 관련 정보 포함량은 많지만 잡음(불필요한 내용) 증가 가능성 있음
- 세밀한 단위(fine-grained): 정밀도 향상 가능성 있으나 검색 부담 증가 및 의미적 무결성 저해
- 검색 세분화 단위는 텍스트와 지식그래프(KG) 영역에서 다양한 수준으로 구분되며, 하류 작업에 맞춰 적응적으로 적용된다.
- 텍스트 기반 검색 세분화
- 세밀한 단위: 토큰·구(Phrase)·문장·명제(Proposition)·청크
- 명제(Proposition): 단일 사실을 포함한 원자적 표현으로, DenseX1에서 제안된 고정밀 검색 단위
- 거친 단위: 문서(Document) 수준
- 지식그래프(KG) 기반 검색 세분화
- 엔티티(Entity): 개별 개념 단위
- 트리플렛(Triplet): (주체-관계-객체) 3요소 구조
- 서브그래프(Sub-Graph): 관련 노드·엣지 집합
- downstream 작업 맞춤형 세분화
- 추천 시스템: 아이템 ID 기반 검색
- 기계 번역: 문장 쌍(Sentence Pair) 단위 검색
B. Indexing Optimization
-
RAG 인덱싱 단계에서 문서 처리 및 청킹 전략은 검색 정확도와 효율성을 결정한다.
-
청킹 전략 핵심 요소
- 고정 토큰 분할: 100/256/512 토큰 단위 분할이 일반적
- 장점: 구현 간편성
- 단점: 문맥 단절 가능성
- 재귀 분할/슬라이딩 윈도우: 계층적 검색을 통해 전역적 문맥 정보 통합
- Small2Big:
- 소형(Small): 문장 단위 검색
- 대형(Big): 인접 문장을 포함한 확장 컨텍스트 제공
-
메타데이터 활용은 RAG 시스템의 검색 정확도와 컨텍스트 적합성을 개선하는 핵심 전략이다.
-
메타데이터 부착 전략
- 기본 메타데이터: 페이지 번호, 파일명, 작성자, 카테고리, 타임스탬프 등을 청크에 추가
- 시간 인식 검색: 문서 타임스탬프에 가중치 부여해 최신 정보 우선 검색
- 인공 메타데이터 생성:
- 문단 요약: LLM을 활용해 청크 내용을 요약한 메타데이터 추가
- 가설 질문 생성(Reverse HyDE): 문서에서 답변 가능한 질문을 LLM으로 생성 후, 원본 질의와의 유사도 계산
-
계층적 구조 인덱스(Structural Index) 구축은 문서 간 관계를 체계화해 RAG 시스템의 검색 속도와 데이터 처리 효율성을 향상시키는 핵심 전략이다.
- 계층적 인덱스 구조 : 부모-자식 관계로 문서를 조직화하고, 각 노드에 데이터 요약을 저장해 신속한 탐색을 지원한다.
- 지식 그래프 인덱스 : 문서 계층 구조 구축 시 개념·엔터티 간 관계를 명확히 정의해 RAG 시스템의 일관성과 정확도를 향상시킨다.
- 주요 기능 :
- 의미적 관계 명시화: 문서 내 문단·표·페이지 노드 간 유사도/구조적 관계를 엣지로 연결
- 다중 문서 통합: KGP1 프레임워크는 KG를 통해 문서 간 지식 검색·추론 문제 해결
C. Query Optimization
-
Naive RAG의 주요 문제점
- 질의 의존성: 사용자 원문 질의를 그대로 검색에 사용해 부정확한 결과 초래
- 모호한 약어 처리: "LLM"과 같은 전문 용어의 다중 의미 구분 실패(예: 대규모 언어 모델(Large Language Model) vs 법학 석사(Master of Laws))
- 언어 복잡성: 전문 용어·구조화되지 않은 질문 처리 능력 부족
-
쿼리 확장 및 검증 기법
- 쿼리 확장(Query Expansion)
- 목적: 단일 질의를 다중 질의로 확장해 문맥적 뉘앙스 보강 및 답변 관련성 극대화
- 방식:
- Multi-Query: LLM을 활용해 질의를 병렬 처리 가능한 다중 하위 질문으로 변환
- Sub-Query : 복잡 질문을 단순 하위 질문으로 분해(예: Least-to-Most 프롬프팅)
- 검증 체인(Chain-of-Verification, CoVe)
- 목적: 확장된 쿼리의 할루시네이션(hallucination) 감소 및 신뢰도 향상
- 쿼리 변환(Query Transformation)
- 목적: 사용자 원본 질의를 변환해 검색 정확도 및 LLM 응답 품질 향상
- 전략: 질의 재작성, 가상 문서 생성, 추상화 질문 생성 등을 활용
- 주요 방법
- 질의 재작성(Query Rewrite)
- LLM 활용: 원본 질의를 최적화된 형태로 재구성(예: "최신 스마트폰 비교" → "2024년 삼성/애플 플래그십 스마트폰 기능 비교")
- 전용 모델(RRR): 검색 효율성 개선을 위한 소규모 언어 모델 적용
- BEQUE 사례: 타오바오에서 long-tail 질의 검색 재현율 향상 및 GMV 증가 달성
* Gross Merchandise Volume(총 상품 거래액)의 약자로, 특정 기간 동안 온라인 플랫폼에서 판매된 상품의 총 가치를 의미
- 가상 문서 생성(HyDE)
- 작동 원리: LLM으로 가정 답변 생성 → 해당 문서 임베딩과 실제 문서 유사도 비교
- 장점: 질문-문서가 아닌 답변-문서 임베딩 유사도 검색으로 정확도 향상
- 한계: LLM이 주제를 모르는 경우 오답 생성 리스크
- 단계적 추상화(Step-back Prompting)
- 고수준 질문 생성: "AI 윤리 문제 해결 방법" → "AI 윤리의 핵심 원칙은 무엇인가?"
- 혼합 검색: 원본 질의와 추상화 질문 결과를 병합해 LLM 답변 생성
- 쿼리 라우팅(Query Routing)
- 목적: 사용자 질의 유형에 따라 최적의 RAG 파이프라인으로 전송해 다양한 시나리오 대응
- 전략: 메타데이터 기반 필터링, 의미적 라우팅, 하이브리드 접근법 결합
D. Embedding
-
RAG 시스템에서 임베딩 모델의 역할과 선택 기준
-
검색 메커니즘
- 유사도 계산: 질문 임베딩과 문서 청크 임베딩 간 코사인 유사도 기반 검색 수행
- 임베딩 모델 종류
- 희소 인코더(Sparse Encoder): BM25 등 키워드 가중치 기반
- 밀집 검색기(Dense Retriever): BERT 계열 사전 학습 모델 사용
-
최신 임베딩 모델 동향
- 다중 작업 지시 튜닝(Multi-task Instruct Tuning): AngIE, Voyage, BGE 등이 해당 기법으로 성능 향상
- 벤치마크:
- MTEB: 8개 작업/58개 데이터셋으로 전방위 평가
- C-MTEB: 중국어 특화 평가(6개 작업/35개 데이터셋)
-
모델 선택 가이드라인
- 범용 모델: MTEB 상위 랭크 모델(예: OpenAI text-embedding-3-large)
- 중국어 특화: C-MTEB에서 검증된 모델(예: BGE)
- 도메인 특화: 의료/법률 등 특정 분야 데이터로 커스텀 평가 필수
-
혼합 검색(Mix/Hybrid Retrieval)
- 목적: 희소(Sparse)와 밀집(Dense) 임베딩의 상호 보완적 장점 결합해 검색 정확도 향상
- 전략:
- 초기 검색 결과 제공: 희소 검색 모델로 초기 결과 생성 → 밀집 검색 모델 학습 데이터로 활용
- 용어 가중치 학습: 사전 학습 언어 모델(PLM)로 용어 중요도 가중치 계산 → 희소 검색 성능 개선
-
임베딩 모델 미세 조정(Fine-tuning)
- 목적: 사전 학습 코퍼스와 도메인 간 차이(전문 용어, 문맥 구조) 해소를 위한 모델 최적화
- 필요성: 의료·법률 등 전문 분야에서 사전 학습 모델의 용어 이해 한계 보완
- 리트리버-생성기 정렬을 위한 미세 조정 기법
- 핵심 목적
- 도메인 지식 보강: 특정 분야(의료/법률 등) 전문 용어 이해력 강화
- 리트리버-생성기 협업 최적화: 검색 모델과 LLM의 출력 일관성 확보
- 주요 방법론
-
LSR(LM-Supervised Retriever):
- 작동 원리: LLM의 출력을 감독 신호로 활용해 리트리버 미세 조정
- 장점: 크로스-어텐션 메커니즘 없이 KL 발산(KL Divergence) 기반 학습 가능(REPLUG 사례)
-
PROMPTAGATOR:
- Few-shot 쿼리 생성: LLM을 이용해 과제 특화 쿼리 생성 → 데이터 부족 분야의 리트리버 훈련
-
LLM-Embedder:
- 하이브리드 감독 신호:
- Hard 라벨: 정답 문서 쌍
- Soft 보상: LLM의 다중 작업 평가 점수
- 효과: 다양한 다운스트림 작업에 대한 임베딩 모델 일반화 능력 향상
-
RLHF 기반 접근:
- 강화 학습 적용: LLM 피드백으로 리트리버 정책 최적화
- 장점: 노이즈 문서(오검색 결과)에 대한 강건성 강화
E. Adapter
-
외부 어댑터 활용 미세 조정 기법
- 문제 해결 목적
- API 통합 한계: 외부 시스템과의 기능 연동 문제
- 자원 제약: 로컬 컴퓨팅 자원(CPU/GPU) 부족 대응
- 주요 방법론
-
UPRISE:
- 경량 프롬프트 검색기: 사전 구축된 프롬프트 풀에서 제로샷(zero-shot) 작업에 적합한 프롬프트 자동 추출
- 적용 효과: 다중 작업 처리 시 별도 미세 조정 없이 최적화
-
AAR(Augmentation-Adapted Retriever):
- 범용 어댑터: 다중 다운스트림 작업을 수용하는 단일 어댑터 설계
- 장점: 메모리 효율적이며 도메인 확장성 보유
-
PRCA:
- 보상 기반 컨텍스트 어댑터: 특정 작업 성능 향상을 위한 플러그형 모듈
- 작동 원리: 작업별 보상 신호에 따라 동적 어댑터 가중치 조정
-
BGM(Bridge Seq2Seq):
-
PKG(지식 통합):
- 지시형 미세 조정: 화이트박스 모델에 지식 직접 주입
- 리트리버 대체: 쿼리 기반 관련 문서 생성 모듈로 교체