[LLM] LLM 시스템을 움직이는 핵심 알고리즘

당니·2026년 1월 30일

LLM

목록 보기

16/19

RAG · Agent · Multimodal · Retrieval 실전 알고리즘 정리

1. RAG (Retrieval-Augmented Generation)

1.1 기본 RAG 파이프라인

RAG는 외부 지식을 활용하여 LLM의 응답 품질을 향상시키는 핵심 기술입니다.

기본 구조:

Query → Embedding → Vector Search → Context Retrieval → LLM Generation

핵심 컴포넌트:

Chunking: 문서를 의미 단위로 분할
Embedding: 텍스트를 벡터로 변환 (OpenAI Ada-002, Cohere Embed v3, BGE 등)
Vector DB: FAISS, Pinecone, Weaviate, Qdrant
Retrieval: Top-k 유사 문서 검색
Generation: 검색된 컨텍스트 기반 응답 생성

1.2 Advanced RAG 기법 (2025-2026 트렌드)

1.2.1 Self-RAG (Self-Reflective RAG)

LLM이 스스로 검색 필요성을 판단하고 생성된 답변의 품질을 평가합니다.

핵심 메커니즘:

Retrieval Necessity: 검색이 필요한지 자체 판단
Relevance Evaluation: 검색된 문서의 관련성 평가
Answer Quality Check: 생성된 답변의 신뢰도 자체 검증

# Self-RAG 의사코드
if model.needs_retrieval(query):
    docs = retrieve(query)
    if model.is_relevant(docs, query):
        answer = generate(query, docs)
        if model.verify_quality(answer):
            return answer
        else:
            return regenerate_or_retrieve_more()

1.2.2 CRAG (Corrective RAG)

검색 결과의 품질을 평가하고 필요시 웹 검색으로 보정합니다.

워크플로우:
1. Initial Retrieval → 관련성 평가
2. Score < threshold → 웹 검색 trigger
3. Knowledge refinement → 노이즈 제거
4. Final generation

1.2.3 HyDE (Hypothetical Document Embeddings)

가상의 답변을 먼저 생성한 후, 이를 쿼리로 사용하여 검색 정확도를 향상시킵니다.

Query → LLM generates hypothetical answer → Embed hypothesis → 
Search with hypothesis embedding → Retrieve actual documents

1.2.4 GraphRAG (2024-2025 주목)

Microsoft에서 개발한 그래프 구조 기반 RAG로, 엔티티와 관계를 그래프로 모델링합니다.

장점:

문서 간 숨겨진 연결 관계 파악
복잡한 다중 홉(multi-hop) 질문 처리
전체적인 맥락(global context) 이해

구조:

Documents → Entity/Relationship Extraction → Knowledge Graph → 
Community Detection → Summary Generation → Query Processing

1.3 최신 임베딩 모델 (2026년 기준)

모델	차원	특징	주요 용도
Cohere Embed v3	1024	다국어 지원, Compression aware	프로덕션
OpenAI text-embedding-3	256~3072	가변 차원, 높은 성능	범용
BGE-M3	1024	Multi-lingual, Multi-granularity	다국어 검색
Voyage AI v2	1024	도메인 특화 fine-tuning	전문 분야
Jina Embeddings v2	768	Long context (8K tokens)	긴 문서

1.4 Reranking 전략

검색 후 reranking으로 정확도를 크게 향상시킬 수 있습니다.

주요 Reranker:

Cohere Rerank: Cross-encoder 기반, 높은 정확도
BGE Reranker: 오픈소스, 빠른 속도
RankGPT: LLM을 reranker로 활용

2단계 검색 파이프라인:

Query → Bi-encoder (1차, 100개 검색) → 
Cross-encoder Reranking (2차, Top 5 선정) → LLM

2. Agent 시스템

2.1 Agent 아키텍처의 진화

2.1.1 ReAct (Reasoning + Acting)

사고(Thought)와 행동(Action)을 교대로 수행하는 패턴입니다.

Thought: 사용자가 날씨를 묻고 있다
Action: search_weather("Seoul")
Observation: 서울 날씨는 영하 5도...
Thought: 정보를 얻었으니 답변 가능
Answer: 서울은 현재 영하 5도입니다.

2.1.2 Tree of Thoughts (ToT)

여러 사고 경로를 탐색하고 최적의 경로를 선택합니다.

구조:

BFS/DFS 스타일의 사고 트리 탐색
각 노드에서 여러 가능성 평가
Backtracking을 통한 최적 경로 찾기

적용 분야: 복잡한 수학 문제, 창의적 글쓰기, 전략 게임

2.1.3 Reflexion (2024-2025 주목)

자기 반성을 통한 지속적 개선 메커니즘입니다.

사이클:

Action → Environment Feedback → Self-Reflection → 
Memory Update → Improved Action

핵심: 실패 경험을 장기 메모리에 저장하여 동일한 실수 방지

2.1.4 AutoGPT & BabyAGI 패러다임

AutoGPT 스타일:

목표 분해 (Goal Decomposition)
자율적 태스크 생성 및 우선순위 설정
지속적 실행 및 피드백 루프

BabyAGI 스타일:

Task Queue 관리
완료된 작업 기반 새 작업 생성
Vector DB에 결과 저장 및 활용

2.2 멀티 에이전트 시스템 (2025-2026 핫트렌드)

2.2.1 AutoGen (Microsoft)

여러 에이전트가 협업하는 프레임워크입니다.

구조:

# 역할 기반 에이전트 협업
UserProxy ↔ AssistantAgent ↔ CodeExecutor
                ↓
            GroupChat (여러 에이전트 토론)

특징:

대화형 에이전트 간 협업
Human-in-the-loop 지원
코드 실행 및 검증

2.2.2 MetaGPT

소프트웨어 개발팀을 시뮬레이션하는 멀티 에이전트 시스템입니다.

에이전트 역할:

Product Manager: 요구사항 분석
Architect: 시스템 설계
Engineer: 코드 작성
QA Engineer: 테스트

워크플로우: 실제 개발 프로세스(PRD → Design → Code → Test)를 모방

2.2.3 LangGraph (LangChain)

상태 머신 기반의 복잡한 에이전트 워크플로우 구축 도구입니다.

핵심 개념:

Nodes: 에이전트 작업 단위
Edges: 노드 간 전환 조건
State: 전체 워크플로우의 상태 관리
Cycles: 반복적 개선 지원

예시:

# 문서 생성 워크플로우
Research → Draft → Review → 
(만족도 평가) → Revise (if needed) → Publish

2.3 Tool Use & Function Calling

3. Multimodal 알고리즘

3.1 Vision-Language Models (VLM)

3.1.1 최신 모델 아키텍처 (2025-2026)

GPT-4V / GPT-4o 계열:

이미지와 텍스트의 통합 처리
OCR, 차트 해석, 시각적 추론
Real-time vision understanding

Claude 3 (Opus/Sonnet/Haiku):

긴 문서 이미지 처리 (수백 페이지)
정확한 공간적 추론
시각적 맥락 이해

Gemini Ultra/Pro:

Native multimodal 아키텍처
비디오 이해 능력
Interleaved image-text reasoning

LLaVA-NeXT (오픈소스):

고해상도 이미지 처리
Dynamic resolution adaptation
효율적인 학습 방법

3.1.2 핵심 기술: Vision Encoder + LLM Alignment

일반적 구조:

Image → Vision Encoder (CLIP/SigLIP) → 
Projection Layer → LLM Input Space → Text Generation

주요 기법:

Q-Former (BLIP-2): Vision과 Language 간 효율적 연결
Perceiver Resampler: 가변 길이 이미지 특징을 고정 길이로 압축
Cross-Attention: Vision과 Text feature의 정교한 융합

3.2 Text-to-Image Generation

3.2.1 Diffusion Models의 지배

DALL-E 3:

자연어 프롬프트 이해 향상
GPT-4 기반 프롬프트 재작성
안전성 필터링 강화

Midjourney v6:

사실적인 이미지 생성
텍스트 렌더링 개선
스타일 일관성

Stable Diffusion XL (SDXL) & SD3:

오픈소스 리더
LoRA, ControlNet 등 확장성
커뮤니티 주도 발전

Imagen 3 (Google):

텍스트 충실도
Photorealistic 이미지

3.2.2 최신 기법들

ControlNet:

Pose, Depth, Canny Edge 등으로 생성 제어
정확한 구도 및 구조 지정

IP-Adapter:

이미지로 스타일 제어
Reference image 기반 생성

InstantID:

단일 얼굴 이미지로 identity 유지
다양한 포즈/표정 생성

3.3 Audio & Video Generation

3.3.1 Text-to-Speech (TTS)

최신 모델 (2026년 기준):

ElevenLabs: 고품질 음성 클로닝, 감정 표현
OpenAI TTS-HD: 자연스러운 억양
Bark: 오픈소스, 다국어 지원
VALL-E X: Few-shot voice cloning

3.3.2 Text-to-Video

Sora (OpenAI, 2024 공개):

최대 60초 고품질 비디오
물리 법칙 이해
복잡한 장면 생성

Runway Gen-2/Gen-3:

텍스트 및 이미지 기반 비디오 생성
Video-to-video transformation
카메라 모션 제어

Pika Labs:

빠른 생성 속도
간단한 인터페이스
스타일 전환

핵심 기술:

Temporal Coherence: 프레임 간 일관성 유지
3D-aware Generation: 공간적 이해
Physics Simulation: 물리 법칙 반영

3.4 Multimodal RAG

멀티모달 검색 전략

1. CLIP 기반 Cross-Modal Retrieval:

Text Query → CLIP Encoder → Semantic Space ← CLIP Encoder ← Images
                    ↓
            Similarity Search → Relevant Images

2. Vision-Language Document Understanding:

PDF, 슬라이드, 차트, 다이어그램 이해
Layout-aware parsing (LayoutLM, Donut)
Table/Chart extraction and reasoning

3. Multimodal Embeddings:

ImageBind (Meta): 6가지 모달리티 통합 임베딩
CLAP: 오디오-텍스트 임베딩
Video-Text Embeddings: 비디오 검색

실무 응용:

# 멀티모달 문서 검색
query = "2023년 매출 증가 차트"
results = multimodal_search(
    query, 
    modalities=["text", "image", "chart"],
    top_k=5
)
# → PDF 문서, 슬라이드, 차트 이미지 모두 검색

4. Advanced Retrieval 기법

4.1 Dense Retrieval의 진화

4.1.1 Contrastive Learning 기반 학습

주요 알고리즘:

SimCSE: Sentence-level contrastive learning
ANCE: Asynchronous negative sample mining
ColBERT v2: Late interaction with token-level matching

ColBERT의 핵심:

Query tokens: [Q1, Q2, Q3]
Doc tokens:   [D1, D2, D3, D4, D5]

Score = Σ max_sim(Qi, Dj) for all i
        (각 쿼리 토큰이 가장 유사한 문서 토큰과 매칭)

4.1.2 Matryoshka Representation Learning

2024-2025년 주목받는 기법으로, 임베딩 차원을 유연하게 조정할 수 있습니다.

핵심 아이디어:

한 번의 학습으로 다양한 차원(64, 128, 256, 512, 1024)의 임베딩 생성
작은 차원: 빠른 검색, 낮은 비용
큰 차원: 높은 정확도

실무 적용:

# 1차 검색: 512차원 (빠름)
candidates = search(query_embedding[:512], top_k=100)

# 2차 정제: 1024차원 (정확함)
final = rerank(query_embedding[:1024], candidates, top_k=10)

4.2 Hybrid Search

Sparse + Dense 결합

BM25 (Sparse) + Dense Embedding:

BM25: 키워드 매칭에 강함
Dense: 의미적 유사도 파악

통합 방법:

Final Score = α × BM25_score + (1-α) × Dense_score

Reciprocal Rank Fusion (RRF):

# 두 검색 결과를 순위 기반으로 융합
score(doc) = Σ 1 / (k + rank_i(doc))

4.3 Query Transformation

4.3.1 Multi-Query Retrieval

하나의 쿼리를 여러 변형으로 확장합니다.

Original: "딥러닝 학습 방법"

Expanded:
- "심층 신경망 훈련 기법"
- "인공신경망 학습 알고리즘"
- "뉴럴 네트워크 최적화"

→ 각각 검색 후 결과 통합

4.3.2 Step-Back Prompting

구체적 질문을 추상적 질문으로 변환하여 검색합니다.

Original: "Claude 3 Opus의 context window는?"

Step-Back: "대형 언어 모델의 context window 비교"

→ 더 넓은 맥락의 문서 검색 → 원래 질문 답변

4.3.3 Query Rewriting with LLM

LLM이 검색 쿼리를 최적화합니다.

# 모호한 쿼리 개선
user_query = "그거 언제 나왔어?"
context = get_conversation_context()

optimized_query = llm.rewrite_query(
    query=user_query,
    context=context
)
# → "Claude 3 Opus 출시 날짜"

4.4 Contextual Retrieval (Anthropic, 2024)

문서 청크에 맥락 정보를 추가하여 검색 정확도를 향상시킵니다.

방법:
1. 각 청크에 대해 LLM이 문서 전체 맥락을 요약한 설명 생성
2. "이 청크는 [문서 전체 맥락]에 대한 문서의 일부이며, [청크 내용]을 다룹니다"
3. 맥락이 추가된 청크를 임베딩

효과:

문맥이 명확하지 않은 대명사/지시어 해결
검색 정확도 35% 향상 (Anthropic 발표)

4.5 Semantic Chunking

전통적 방식의 한계

고정 길이 분할 (512 tokens): 의미 단위 무시
Overlap: 중복은 있지만 근본적 해결 안됨

5. 실무 적용 사례

5.1 기업 지식 베이스 구축

Architecture:

기업 문서 (PDF, DOCX, Slides, Web) 
    → Parsing (Unstructured.io, LlamaParse)
    → Semantic Chunking
    → Contextual Embedding
    → Vector DB (Pinecone/Weaviate)
    → GraphRAG (엔티티/관계 추출)
    → Hybrid Search (BM25 + Dense)
    → Reranking (Cohere Rerank)
    → LLM + Citation

핵심 포인트:

정확한 출처 표시: 환각 방지, 신뢰도 향상
접근 권한 관리: Metadata filtering
지속적 업데이트: Incremental indexing

5.2 고객 지원 Agent

멀티 에이전트 구성:

Classifier Agent: 문의 유형 분류
FAQ Agent: 간단한 질문 즉답
RAG Agent: 매뉴얼/문서 검색 기반 답변
Ticket Agent: 복잡한 이슈는 티켓 생성
Escalation Agent: 사람에게 전달 여부 판단

워크플로우 (LangGraph):

User Query → Classifier → 
    ├─ FAQ (simple) → Answer
    ├─ RAG (medium) → Document Search → Answer
    └─ Complex → Ticket Creation + Human Escalation

성과:

응답 시간 70% 감소
고객 만족도 25% 향상
에이전트 업무 부담 50% 경감

5.3 Code Assistant

기능:

Code Search: 기존 코드베이스에서 유사 패턴 검색
Documentation RAG: API 문서, 튜토리얼 참조
Test Generation: 자동 테스트 케이스 생성
Bug Detection: 잠재적 버그 탐지 및 수정 제안

Architecture:

Code Query → 
    ├─ Code Embedding (CodeBERT/GraphCodeBERT)
    ├─ AST Parsing
    ├─ Repository Structure Analysis
    └─ Function Call Detection

Context → GPT-4/Claude + RAG → 
    ├─ Code Completion
    ├─ Explanation
    └─ Refactoring Suggestion

주요 도구:

GitHub Copilot (GPT-4 기반)
Cursor (Claude 통합)
Amazon CodeWhisperer
Tabnine

5.4 Multimodal Content Creation

시나리오: 마케팅 자료 자동 생성

Pipeline:

Product Info (Text + Images) →
    ├─ Vision-Language Analysis
    ├─ Brand Guideline RAG
    └─ Template Selection

Generation →
    ├─ Copywriting (GPT-4)
    ├─ Image Generation (DALL-E 3/Midjourney)
    ├─ Layout Design (Auto)
    └─ Final Assembly (PPTX/PDF)

적용 사례:

소셜 미디어 포스트 자동 생성
제품 카탈로그 제작
광고 크리에이티브 대량 생성

5.5 Research Assistant

최신 트렌드: Deep Research (2025-2026)

Perplexity Pro Research:

수백 개 소스 자동 탐색
상호 검증을 통한 fact-checking
구조화된 리포트 생성

Claude + Deep Research:

다단계 쿼리 계획 수립
병렬 검색 및 종합
비판적 분석 및 통찰 도출

Architecture:

Research Question →
    ├─ Query Decomposition (5-10 sub-questions)
    ├─ Parallel Web Search (각 sub-question)
    ├─ Source Evaluation (신뢰도 평가)
    ├─ Cross-Reference Check
    └─ Synthesis & Report Generation

Iteration →
    ├─ Gap Analysis
    ├─ Follow-up Questions
    └─ Refinement

6. 미래 전망 및 새로운 방향

6.1 Long Context의 시대

최신 모델들의 Context Window:

Claude 3 Opus: 200K tokens
GPT-4 Turbo: 128K tokens
Gemini 1.5 Pro: 1M tokens (실험적 2M)
Command R+: 128K tokens

영향:

RAG의 역할 변화: 필터링 및 관련 문서 선별이 더 중요
In-context Learning의 확장
Few-shot → Many-shot 학습

6.2 Mixture of Experts (MoE) 활용

Sparse MoE Architecture:

전체 모델의 일부만 활성화
효율성과 성능의 균형
Mixtral 8x7B, GPT-4 (추정)

Agent에서의 응용:

Task-specific expert routing
Dynamic model selection

6.3 On-device AI & Edge Deployment

Trend:

Llama 3.1 8B, Phi-3, Gemma 2 등 소형 모델 발전
양자화(Quantization): 4-bit, 8-bit 모델
로컬 실행으로 프라이버시 보호

기술:

LoRA: 효율적 fine-tuning
QLoRA: 양자화 + LoRA
GGUF: CPU 최적화 포맷

6.4 Constitutional AI & Alignment

안전하고 유용한 AI:

RLHF (Reinforcement Learning from Human Feedback)
Constitutional AI (Anthropic)
Red Teaming & Adversarial Testing

실무 적용:

Guardrails: 유해 출력 방지
Output Verification: 생성 결과 검증
Human-in-the-loop: 중요 결정에 사람 개입

7. 핵심 알고리즘 요약표

RAG 알고리즘

알고리즘	핵심 개념	장점	사용 시기
Naive RAG	Query → Retrieve → Generate	간단, 빠름	기본 Q&A
Self-RAG	자체 검색 필요성 판단	효율성, 정확도 향상	복잡한 쿼리
CRAG	검색 결과 품질 평가 + 웹 검색	신뢰도 높음	Fact-checking 중요
HyDE	가상 답변으로 검색	의미적 검색 향상	추상적 질문
GraphRAG	그래프 구조 활용	관계 파악, 전체 맥락	복잡한 지식 베이스

Agent 알고리즘

알고리즘	핵심 개념	장점	사용 시기
ReAct	Thought-Action-Observation	해석 가능성	도구 사용 필요
Tree of Thoughts	사고 트리 탐색	창의적 문제 해결	복잡한 추론
Reflexion	자기 반성 + 메모리	지속적 개선	반복 작업
AutoGen	멀티 에이전트 협업	역할 분담 효과	복잡한 프로젝트
LangGraph	상태 머신 워크플로우	유연한 제어	복잡한 파이프라인

Retrieval 알고리즘

알고리즘	핵심 개념	장점	사용 시기
BM25	Sparse retrieval	키워드 매칭 강함	정확한 용어 검색
Dense Retrieval	Semantic embedding	의미 파악 우수	자연어 쿼리
Hybrid Search	Sparse + Dense	양쪽 장점 결합	대부분의 경우
ColBERT	Late interaction	정확도 + 효율성	고품질 검색 필요
Reranking	2단계 정제	최종 정확도 향상	정확도 중요

8. 실전 체크리스트

RAG 시스템 구축 시

문서 파싱 품질 확인 (PDF, 표, 이미지 포함)
Chunking 전략 최적화 (의미 단위 고려)
적절한 임베딩 모델 선택 (도메인, 언어, 성능)
Hybrid Search 적용 (BM25 + Dense)
Reranking 단계 추가
출처 표시 (Citation) 구현
평가 메트릭 설정 (Precision@k, MRR, NDCG)
A/B 테스트로 지속적 개선

Agent 시스템 구축 시

명확한 도구(Tool) 정의 및 문서화
에러 처리 및 재시도 로직
무한 루프 방지 (최대 반복 횟수 설정)
비용 모니터링 (토큰 사용량)
Human-in-the-loop 지점 설정
로깅 및 추적 (Observability)
보안 고려 (코드 실행, API 호출 권한)

Multimodal 시스템 구축 시

이미지 전처리 (해상도, 포맷)
Modality 간 정렬 (Alignment) 품질
적절한 프롬프팅 (Vision 모델 특성 고려)
안전 필터링 (유해 이미지 생성 방지)
비용 최적화 (Vision API는 일반적으로 비쌈)

9. 참고 자료

주요 프레임워크 & 라이브러리

LLM 오케스트레이션:

LangChain: https://github.com/langchain-ai/langchain
LlamaIndex: https://github.com/run-llama/llama_index
Haystack: https://github.com/deepset-ai/haystack
Semantic Kernel: https://github.com/microsoft/semantic-kernel

Vector DB:

Multimodal:

Transformers (Hugging Face): https://github.com/huggingface/transformers
OpenCLIP: https://github.com/mlfoundations/open_clip
LLaVA: https://github.com/haotian-liu/LLaVA

Agent Frameworks:

AutoGen: https://github.com/microsoft/autogen
CrewAI: https://github.com/joaomdmoura/crewAI
LangGraph: https://github.com/langchain-ai/langgraph

학습 자료

논문:

"Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks" (2020)
"Self-RAG: Learning to Retrieve, Generate, and Critique through Self-Reflection" (2023)
"Tree of Thoughts: Deliberate Problem Solving with Large Language Models" (2023)
"Reflexion: Language Agents with Verbal Reinforcement Learning" (2023)
"From Local to Global: A Graph RAG Approach" (Microsoft, 2024)

블로그 & 문서:

Anthropic Documentation: https://docs.anthropic.com/
OpenAI Cookbook: https://cookbook.openai.com/
LangChain Blog: https://blog.langchain.dev/
Pinecone Learning Center: https://www.pinecone.io/learn/

마치며

2026년 현재, LLM 시스템은 RAG, Agent, Multimodal, Advanced Retrieval 기법들의 통합을 통해 더욱 강력하고 실용적인 애플리케이션으로 진화하고 있습니다.

핵심 트렌드:
1. Long Context + RAG의 시너지: RAG는 사라지지 않고 정제된 형태로 진화
2. 멀티 에이전트 시스템의 부상: 복잡한 작업을 역할 분담으로 해결
3. Multimodal의 일상화: 텍스트만이 아닌 모든 형태의 정보 처리
4. 효율성과 성능의 균형: 작은 모델 + 똑똑한 전략

실무에서는 최신 알고리즘을 맹목적으로 따르기보다는, 문제의 본질을 파악하고 적절한 도구를 선택하는 것이 중요합니다. 간단한 RAG로 충분한 경우도 많고, 복잡한 멀티 에이전트가 필요한 경우도 있습니다.

지속적인 실험, 평가, 개선의 사이클을 통해 최적화된 LLM 시스템을 구축하시기 바랍니다!

당니

👩🏻‍💻

이전 포스트

[Hybrid Search] Hybrid Search: 키워드와 의미를 결합한 차세대 검색 기술

다음 포스트

[LLM] LLM 시스템을 움직이는 핵심 알고리즘

LLM

목차

1. RAG (Retrieval-Augmented Generation)

1.1 기본 RAG 파이프라인

1.2 Advanced RAG 기법 (2025-2026 트렌드)

1.2.1 Self-RAG (Self-Reflective RAG)

1.2.2 CRAG (Corrective RAG)

1.2.3 HyDE (Hypothetical Document Embeddings)

1.2.4 GraphRAG (2024-2025 주목)

1.3 최신 임베딩 모델 (2026년 기준)

1.4 Reranking 전략

2. Agent 시스템

2.1 Agent 아키텍처의 진화

2.1.1 ReAct (Reasoning + Acting)

2.1.2 Tree of Thoughts (ToT)

2.1.3 Reflexion (2024-2025 주목)

2.1.4 AutoGPT & BabyAGI 패러다임

2.2 멀티 에이전트 시스템 (2025-2026 핫트렌드)

2.2.1 AutoGen (Microsoft)

2.2.2 MetaGPT

2.2.3 LangGraph (LangChain)

2.3 Tool Use & Function Calling

최신 트렌드 (2026년 기준)

3. Multimodal 알고리즘

3.1 Vision-Language Models (VLM)

3.1.1 최신 모델 아키텍처 (2025-2026)

3.1.2 핵심 기술: Vision Encoder + LLM Alignment

3.2 Text-to-Image Generation

3.2.1 Diffusion Models의 지배

3.2.2 최신 기법들

3.3 Audio & Video Generation

3.3.1 Text-to-Speech (TTS)

3.3.2 Text-to-Video

3.4 Multimodal RAG

멀티모달 검색 전략

4. Advanced Retrieval 기법

4.1 Dense Retrieval의 진화

4.1.1 Contrastive Learning 기반 학습

4.1.2 Matryoshka Representation Learning

4.2 Hybrid Search

Sparse + Dense 결합

4.3 Query Transformation

4.3.1 Multi-Query Retrieval

4.3.2 Step-Back Prompting

4.3.3 Query Rewriting with LLM

4.4 Contextual Retrieval (Anthropic, 2024)

4.5 Semantic Chunking

전통적 방식의 한계

최신 Chunking 전략

5. 실무 적용 사례

5.1 기업 지식 베이스 구축

5.2 고객 지원 Agent

5.3 Code Assistant

5.4 Multimodal Content Creation

5.5 Research Assistant

6. 미래 전망 및 새로운 방향

6.1 Long Context의 시대

6.2 Mixture of Experts (MoE) 활용

6.3 On-device AI & Edge Deployment

6.4 Constitutional AI & Alignment

7. 핵심 알고리즘 요약표

RAG 알고리즘

Agent 알고리즘

Retrieval 알고리즘

8. 실전 체크리스트

RAG 시스템 구축 시

Agent 시스템 구축 시

Multimodal 시스템 구축 시

9. 참고 자료

주요 프레임워크 & 라이브러리

학습 자료

마치며

[Hybrid Search] Hybrid Search: 키워드와 의미를 결합한 차세대 검색 기술

[RAG] RAG 시스템의 핵심: 청킹(Chunking) 완벽 가이드

0개의 댓글