[LLM] LLM 시스템을 움직이는 핵심 알고리즘

당니·2026년 1월 30일

LLM

목록 보기
16/19
post-thumbnail

RAG · Agent · Multimodal · Retrieval 실전 알고리즘 정리

목차

  1. RAG (Retrieval-Augmented Generation)
  2. Agent 시스템
  3. Multimodal 알고리즘
  4. Advanced Retrieval 기법
  5. 실무 적용 사례

1. RAG (Retrieval-Augmented Generation)

1.1 기본 RAG 파이프라인

RAG는 외부 지식을 활용하여 LLM의 응답 품질을 향상시키는 핵심 기술입니다.

기본 구조:

Query → Embedding → Vector Search → Context Retrieval → LLM Generation

핵심 컴포넌트:

  • Chunking: 문서를 의미 단위로 분할
  • Embedding: 텍스트를 벡터로 변환 (OpenAI Ada-002, Cohere Embed v3, BGE 등)
  • Vector DB: FAISS, Pinecone, Weaviate, Qdrant
  • Retrieval: Top-k 유사 문서 검색
  • Generation: 검색된 컨텍스트 기반 응답 생성

1.2 Advanced RAG 기법 (2025-2026 트렌드)

1.2.1 Self-RAG (Self-Reflective RAG)

LLM이 스스로 검색 필요성을 판단하고 생성된 답변의 품질을 평가합니다.

핵심 메커니즘:

  • Retrieval Necessity: 검색이 필요한지 자체 판단
  • Relevance Evaluation: 검색된 문서의 관련성 평가
  • Answer Quality Check: 생성된 답변의 신뢰도 자체 검증
# Self-RAG 의사코드
if model.needs_retrieval(query):
    docs = retrieve(query)
    if model.is_relevant(docs, query):
        answer = generate(query, docs)
        if model.verify_quality(answer):
            return answer
        else:
            return regenerate_or_retrieve_more()

1.2.2 CRAG (Corrective RAG)

검색 결과의 품질을 평가하고 필요시 웹 검색으로 보정합니다.

워크플로우:
1. Initial Retrieval → 관련성 평가
2. Score < threshold → 웹 검색 trigger
3. Knowledge refinement → 노이즈 제거
4. Final generation

1.2.3 HyDE (Hypothetical Document Embeddings)

가상의 답변을 먼저 생성한 후, 이를 쿼리로 사용하여 검색 정확도를 향상시킵니다.

Query → LLM generates hypothetical answer → Embed hypothesis → 
Search with hypothesis embedding → Retrieve actual documents

1.2.4 GraphRAG (2024-2025 주목)

Microsoft에서 개발한 그래프 구조 기반 RAG로, 엔티티와 관계를 그래프로 모델링합니다.

장점:

  • 문서 간 숨겨진 연결 관계 파악
  • 복잡한 다중 홉(multi-hop) 질문 처리
  • 전체적인 맥락(global context) 이해

구조:

Documents → Entity/Relationship Extraction → Knowledge Graph → 
Community Detection → Summary Generation → Query Processing

1.3 최신 임베딩 모델 (2026년 기준)

모델차원특징주요 용도
Cohere Embed v31024다국어 지원, Compression aware프로덕션
OpenAI text-embedding-3256~3072가변 차원, 높은 성능범용
BGE-M31024Multi-lingual, Multi-granularity다국어 검색
Voyage AI v21024도메인 특화 fine-tuning전문 분야
Jina Embeddings v2768Long context (8K tokens)긴 문서

1.4 Reranking 전략

검색 후 reranking으로 정확도를 크게 향상시킬 수 있습니다.

주요 Reranker:

  • Cohere Rerank: Cross-encoder 기반, 높은 정확도
  • BGE Reranker: 오픈소스, 빠른 속도
  • RankGPT: LLM을 reranker로 활용

2단계 검색 파이프라인:

Query → Bi-encoder (1차, 100개 검색) → 
Cross-encoder Reranking (2차, Top 5 선정) → LLM

2. Agent 시스템

2.1 Agent 아키텍처의 진화

2.1.1 ReAct (Reasoning + Acting)

사고(Thought)와 행동(Action)을 교대로 수행하는 패턴입니다.

Thought: 사용자가 날씨를 묻고 있다
Action: search_weather("Seoul")
Observation: 서울 날씨는 영하 5도...
Thought: 정보를 얻었으니 답변 가능
Answer: 서울은 현재 영하 5도입니다.

2.1.2 Tree of Thoughts (ToT)

여러 사고 경로를 탐색하고 최적의 경로를 선택합니다.

구조:

  • BFS/DFS 스타일의 사고 트리 탐색
  • 각 노드에서 여러 가능성 평가
  • Backtracking을 통한 최적 경로 찾기

적용 분야: 복잡한 수학 문제, 창의적 글쓰기, 전략 게임

2.1.3 Reflexion (2024-2025 주목)

자기 반성을 통한 지속적 개선 메커니즘입니다.

사이클:

Action → Environment Feedback → Self-Reflection → 
Memory Update → Improved Action

핵심: 실패 경험을 장기 메모리에 저장하여 동일한 실수 방지

2.1.4 AutoGPT & BabyAGI 패러다임

AutoGPT 스타일:

  • 목표 분해 (Goal Decomposition)
  • 자율적 태스크 생성 및 우선순위 설정
  • 지속적 실행 및 피드백 루프

BabyAGI 스타일:

  • Task Queue 관리
  • 완료된 작업 기반 새 작업 생성
  • Vector DB에 결과 저장 및 활용

2.2 멀티 에이전트 시스템 (2025-2026 핫트렌드)

2.2.1 AutoGen (Microsoft)

여러 에이전트가 협업하는 프레임워크입니다.

구조:

# 역할 기반 에이전트 협업
UserProxy ↔ AssistantAgent ↔ CodeExecutor
                ↓
            GroupChat (여러 에이전트 토론)

특징:

  • 대화형 에이전트 간 협업
  • Human-in-the-loop 지원
  • 코드 실행 및 검증

2.2.2 MetaGPT

소프트웨어 개발팀을 시뮬레이션하는 멀티 에이전트 시스템입니다.

에이전트 역할:

  • Product Manager: 요구사항 분석
  • Architect: 시스템 설계
  • Engineer: 코드 작성
  • QA Engineer: 테스트

워크플로우: 실제 개발 프로세스(PRD → Design → Code → Test)를 모방

2.2.3 LangGraph (LangChain)

상태 머신 기반의 복잡한 에이전트 워크플로우 구축 도구입니다.

핵심 개념:

  • Nodes: 에이전트 작업 단위
  • Edges: 노드 간 전환 조건
  • State: 전체 워크플로우의 상태 관리
  • Cycles: 반복적 개선 지원

예시:

# 문서 생성 워크플로우
Research → Draft → Review → 
(만족도 평가) → Revise (if needed) → Publish

2.3 Tool Use & Function Calling

최신 트렌드 (2026년 기준)

1. Parallel Function Calling

  • 여러 도구를 동시에 호출하여 효율성 향상
  • Claude, GPT-4, Gemini 모두 지원

2. Structured Output

  • JSON Schema 기반 정확한 출력 보장
  • 함수 호출 파라미터의 타입 안정성 확보

3. Vision Tool Use

  • 이미지를 입력받아 적절한 도구 선택 및 실행
  • GPT-4V, Claude 3, Gemini Ultra의 핵심 기능

실무 패턴:

tools = [
    {"name": "search", "description": "웹 검색"},
    {"name": "calculator", "description": "수학 계산"},
    {"name": "code_executor", "description": "코드 실행"},
    {"name": "database_query", "description": "DB 조회"}
]

# LLM이 상황에 맞는 도구 자동 선택
response = llm.invoke(query, tools=tools)

3. Multimodal 알고리즘

3.1 Vision-Language Models (VLM)

3.1.1 최신 모델 아키텍처 (2025-2026)

GPT-4V / GPT-4o 계열:

  • 이미지와 텍스트의 통합 처리
  • OCR, 차트 해석, 시각적 추론
  • Real-time vision understanding

Claude 3 (Opus/Sonnet/Haiku):

  • 긴 문서 이미지 처리 (수백 페이지)
  • 정확한 공간적 추론
  • 시각적 맥락 이해

Gemini Ultra/Pro:

  • Native multimodal 아키텍처
  • 비디오 이해 능력
  • Interleaved image-text reasoning

LLaVA-NeXT (오픈소스):

  • 고해상도 이미지 처리
  • Dynamic resolution adaptation
  • 효율적인 학습 방법

3.1.2 핵심 기술: Vision Encoder + LLM Alignment

일반적 구조:

Image → Vision Encoder (CLIP/SigLIP) → 
Projection Layer → LLM Input Space → Text Generation

주요 기법:

  • Q-Former (BLIP-2): Vision과 Language 간 효율적 연결
  • Perceiver Resampler: 가변 길이 이미지 특징을 고정 길이로 압축
  • Cross-Attention: Vision과 Text feature의 정교한 융합

3.2 Text-to-Image Generation

3.2.1 Diffusion Models의 지배

DALL-E 3:

  • 자연어 프롬프트 이해 향상
  • GPT-4 기반 프롬프트 재작성
  • 안전성 필터링 강화

Midjourney v6:

  • 사실적인 이미지 생성
  • 텍스트 렌더링 개선
  • 스타일 일관성

Stable Diffusion XL (SDXL) & SD3:

  • 오픈소스 리더
  • LoRA, ControlNet 등 확장성
  • 커뮤니티 주도 발전

Imagen 3 (Google):

  • 텍스트 충실도
  • Photorealistic 이미지

3.2.2 최신 기법들

ControlNet:

  • Pose, Depth, Canny Edge 등으로 생성 제어
  • 정확한 구도 및 구조 지정

IP-Adapter:

  • 이미지로 스타일 제어
  • Reference image 기반 생성

InstantID:

  • 단일 얼굴 이미지로 identity 유지
  • 다양한 포즈/표정 생성

3.3 Audio & Video Generation

3.3.1 Text-to-Speech (TTS)

최신 모델 (2026년 기준):

  • ElevenLabs: 고품질 음성 클로닝, 감정 표현
  • OpenAI TTS-HD: 자연스러운 억양
  • Bark: 오픈소스, 다국어 지원
  • VALL-E X: Few-shot voice cloning

3.3.2 Text-to-Video

Sora (OpenAI, 2024 공개):

  • 최대 60초 고품질 비디오
  • 물리 법칙 이해
  • 복잡한 장면 생성

Runway Gen-2/Gen-3:

  • 텍스트 및 이미지 기반 비디오 생성
  • Video-to-video transformation
  • 카메라 모션 제어

Pika Labs:

  • 빠른 생성 속도
  • 간단한 인터페이스
  • 스타일 전환

핵심 기술:

  • Temporal Coherence: 프레임 간 일관성 유지
  • 3D-aware Generation: 공간적 이해
  • Physics Simulation: 물리 법칙 반영

3.4 Multimodal RAG

멀티모달 검색 전략

1. CLIP 기반 Cross-Modal Retrieval:

Text Query → CLIP Encoder → Semantic Space ← CLIP Encoder ← Images
                    ↓
            Similarity Search → Relevant Images

2. Vision-Language Document Understanding:

  • PDF, 슬라이드, 차트, 다이어그램 이해
  • Layout-aware parsing (LayoutLM, Donut)
  • Table/Chart extraction and reasoning

3. Multimodal Embeddings:

  • ImageBind (Meta): 6가지 모달리티 통합 임베딩
  • CLAP: 오디오-텍스트 임베딩
  • Video-Text Embeddings: 비디오 검색

실무 응용:

# 멀티모달 문서 검색
query = "2023년 매출 증가 차트"
results = multimodal_search(
    query, 
    modalities=["text", "image", "chart"],
    top_k=5
)
# → PDF 문서, 슬라이드, 차트 이미지 모두 검색

4. Advanced Retrieval 기법

4.1 Dense Retrieval의 진화

4.1.1 Contrastive Learning 기반 학습

주요 알고리즘:

  • SimCSE: Sentence-level contrastive learning
  • ANCE: Asynchronous negative sample mining
  • ColBERT v2: Late interaction with token-level matching

ColBERT의 핵심:

Query tokens: [Q1, Q2, Q3]
Doc tokens:   [D1, D2, D3, D4, D5]

Score = Σ max_sim(Qi, Dj) for all i
        (각 쿼리 토큰이 가장 유사한 문서 토큰과 매칭)

4.1.2 Matryoshka Representation Learning

2024-2025년 주목받는 기법으로, 임베딩 차원을 유연하게 조정할 수 있습니다.

핵심 아이디어:

  • 한 번의 학습으로 다양한 차원(64, 128, 256, 512, 1024)의 임베딩 생성
  • 작은 차원: 빠른 검색, 낮은 비용
  • 큰 차원: 높은 정확도

실무 적용:

# 1차 검색: 512차원 (빠름)
candidates = search(query_embedding[:512], top_k=100)

# 2차 정제: 1024차원 (정확함)
final = rerank(query_embedding[:1024], candidates, top_k=10)

Sparse + Dense 결합

BM25 (Sparse) + Dense Embedding:

  • BM25: 키워드 매칭에 강함
  • Dense: 의미적 유사도 파악

통합 방법:

Final Score = α × BM25_score + (1-α) × Dense_score

Reciprocal Rank Fusion (RRF):

# 두 검색 결과를 순위 기반으로 융합
score(doc) = Σ 1 / (k + rank_i(doc))

4.3 Query Transformation

4.3.1 Multi-Query Retrieval

하나의 쿼리를 여러 변형으로 확장합니다.

Original: "딥러닝 학습 방법"

Expanded:
- "심층 신경망 훈련 기법"
- "인공신경망 학습 알고리즘"
- "뉴럴 네트워크 최적화"

→ 각각 검색 후 결과 통합

4.3.2 Step-Back Prompting

구체적 질문을 추상적 질문으로 변환하여 검색합니다.

Original: "Claude 3 Opus의 context window는?"

Step-Back: "대형 언어 모델의 context window 비교"

→ 더 넓은 맥락의 문서 검색 → 원래 질문 답변

4.3.3 Query Rewriting with LLM

LLM이 검색 쿼리를 최적화합니다.

# 모호한 쿼리 개선
user_query = "그거 언제 나왔어?"
context = get_conversation_context()

optimized_query = llm.rewrite_query(
    query=user_query,
    context=context
)
# → "Claude 3 Opus 출시 날짜"

4.4 Contextual Retrieval (Anthropic, 2024)

문서 청크에 맥락 정보를 추가하여 검색 정확도를 향상시킵니다.

방법:
1. 각 청크에 대해 LLM이 문서 전체 맥락을 요약한 설명 생성
2. "이 청크는 [문서 전체 맥락]에 대한 문서의 일부이며, [청크 내용]을 다룹니다"
3. 맥락이 추가된 청크를 임베딩

효과:

  • 문맥이 명확하지 않은 대명사/지시어 해결
  • 검색 정확도 35% 향상 (Anthropic 발표)

4.5 Semantic Chunking

전통적 방식의 한계

  • 고정 길이 분할 (512 tokens): 의미 단위 무시
  • Overlap: 중복은 있지만 근본적 해결 안됨

최신 Chunking 전략

1. Semantic Chunking:

  • 문장 임베딩 유사도 기반 분할
  • 의미적으로 연관된 문장들을 하나의 청크로

2. Recursive Chunking:

  • 문서 구조 (제목, 단락, 문장) 고려
  • 계층적 분할

3. Agent-based Chunking:

  • LLM이 문서를 읽고 자연스러운 분할점 결정
  • 문맥 보존에 최적

실무 권장:

# 하이브리드 접근
1. Recursive로 대략적 분할 (문서 구조 기반)
2. Semantic similarity로 정제
3. 청크 크기 제약 (100-800 tokens)

5. 실무 적용 사례

5.1 기업 지식 베이스 구축

Architecture:

기업 문서 (PDF, DOCX, Slides, Web) 
    → Parsing (Unstructured.io, LlamaParse)
    → Semantic Chunking
    → Contextual Embedding
    → Vector DB (Pinecone/Weaviate)
    → GraphRAG (엔티티/관계 추출)
    → Hybrid Search (BM25 + Dense)
    → Reranking (Cohere Rerank)
    → LLM + Citation

핵심 포인트:

  • 정확한 출처 표시: 환각 방지, 신뢰도 향상
  • 접근 권한 관리: Metadata filtering
  • 지속적 업데이트: Incremental indexing

5.2 고객 지원 Agent

멀티 에이전트 구성:

  1. Classifier Agent: 문의 유형 분류
  2. FAQ Agent: 간단한 질문 즉답
  3. RAG Agent: 매뉴얼/문서 검색 기반 답변
  4. Ticket Agent: 복잡한 이슈는 티켓 생성
  5. Escalation Agent: 사람에게 전달 여부 판단

워크플로우 (LangGraph):

User Query → Classifier → 
    ├─ FAQ (simple) → Answer
    ├─ RAG (medium) → Document Search → Answer
    └─ Complex → Ticket Creation + Human Escalation

성과:

  • 응답 시간 70% 감소
  • 고객 만족도 25% 향상
  • 에이전트 업무 부담 50% 경감

5.3 Code Assistant

기능:

  • Code Search: 기존 코드베이스에서 유사 패턴 검색
  • Documentation RAG: API 문서, 튜토리얼 참조
  • Test Generation: 자동 테스트 케이스 생성
  • Bug Detection: 잠재적 버그 탐지 및 수정 제안

Architecture:

Code Query → 
    ├─ Code Embedding (CodeBERT/GraphCodeBERT)
    ├─ AST Parsing
    ├─ Repository Structure Analysis
    └─ Function Call Detection

Context → GPT-4/Claude + RAG → 
    ├─ Code Completion
    ├─ Explanation
    └─ Refactoring Suggestion

주요 도구:

  • GitHub Copilot (GPT-4 기반)
  • Cursor (Claude 통합)
  • Amazon CodeWhisperer
  • Tabnine

5.4 Multimodal Content Creation

시나리오: 마케팅 자료 자동 생성

Pipeline:

Product Info (Text + Images) →
    ├─ Vision-Language Analysis
    ├─ Brand Guideline RAG
    └─ Template Selection

Generation →
    ├─ Copywriting (GPT-4)
    ├─ Image Generation (DALL-E 3/Midjourney)
    ├─ Layout Design (Auto)
    └─ Final Assembly (PPTX/PDF)

적용 사례:

  • 소셜 미디어 포스트 자동 생성
  • 제품 카탈로그 제작
  • 광고 크리에이티브 대량 생성

5.5 Research Assistant

최신 트렌드: Deep Research (2025-2026)

Perplexity Pro Research:

  • 수백 개 소스 자동 탐색
  • 상호 검증을 통한 fact-checking
  • 구조화된 리포트 생성

Claude + Deep Research:

  • 다단계 쿼리 계획 수립
  • 병렬 검색 및 종합
  • 비판적 분석 및 통찰 도출

Architecture:

Research Question →
    ├─ Query Decomposition (5-10 sub-questions)
    ├─ Parallel Web Search (각 sub-question)
    ├─ Source Evaluation (신뢰도 평가)
    ├─ Cross-Reference Check
    └─ Synthesis & Report Generation

Iteration →
    ├─ Gap Analysis
    ├─ Follow-up Questions
    └─ Refinement

6. 미래 전망 및 새로운 방향

6.1 Long Context의 시대

최신 모델들의 Context Window:

  • Claude 3 Opus: 200K tokens
  • GPT-4 Turbo: 128K tokens
  • Gemini 1.5 Pro: 1M tokens (실험적 2M)
  • Command R+: 128K tokens

영향:

  • RAG의 역할 변화: 필터링 및 관련 문서 선별이 더 중요
  • In-context Learning의 확장
  • Few-shot → Many-shot 학습

6.2 Mixture of Experts (MoE) 활용

Sparse MoE Architecture:

  • 전체 모델의 일부만 활성화
  • 효율성과 성능의 균형
  • Mixtral 8x7B, GPT-4 (추정)

Agent에서의 응용:

  • Task-specific expert routing
  • Dynamic model selection

6.3 On-device AI & Edge Deployment

Trend:

  • Llama 3.1 8B, Phi-3, Gemma 2 등 소형 모델 발전
  • 양자화(Quantization): 4-bit, 8-bit 모델
  • 로컬 실행으로 프라이버시 보호

기술:

  • LoRA: 효율적 fine-tuning
  • QLoRA: 양자화 + LoRA
  • GGUF: CPU 최적화 포맷

6.4 Constitutional AI & Alignment

안전하고 유용한 AI:

  • RLHF (Reinforcement Learning from Human Feedback)
  • Constitutional AI (Anthropic)
  • Red Teaming & Adversarial Testing

실무 적용:

  • Guardrails: 유해 출력 방지
  • Output Verification: 생성 결과 검증
  • Human-in-the-loop: 중요 결정에 사람 개입

7. 핵심 알고리즘 요약표

RAG 알고리즘

알고리즘핵심 개념장점사용 시기
Naive RAGQuery → Retrieve → Generate간단, 빠름기본 Q&A
Self-RAG자체 검색 필요성 판단효율성, 정확도 향상복잡한 쿼리
CRAG검색 결과 품질 평가 + 웹 검색신뢰도 높음Fact-checking 중요
HyDE가상 답변으로 검색의미적 검색 향상추상적 질문
GraphRAG그래프 구조 활용관계 파악, 전체 맥락복잡한 지식 베이스

Agent 알고리즘

알고리즘핵심 개념장점사용 시기
ReActThought-Action-Observation해석 가능성도구 사용 필요
Tree of Thoughts사고 트리 탐색창의적 문제 해결복잡한 추론
Reflexion자기 반성 + 메모리지속적 개선반복 작업
AutoGen멀티 에이전트 협업역할 분담 효과복잡한 프로젝트
LangGraph상태 머신 워크플로우유연한 제어복잡한 파이프라인

Retrieval 알고리즘

알고리즘핵심 개념장점사용 시기
BM25Sparse retrieval키워드 매칭 강함정확한 용어 검색
Dense RetrievalSemantic embedding의미 파악 우수자연어 쿼리
Hybrid SearchSparse + Dense양쪽 장점 결합대부분의 경우
ColBERTLate interaction정확도 + 효율성고품질 검색 필요
Reranking2단계 정제최종 정확도 향상정확도 중요

8. 실전 체크리스트

RAG 시스템 구축 시

  • 문서 파싱 품질 확인 (PDF, 표, 이미지 포함)
  • Chunking 전략 최적화 (의미 단위 고려)
  • 적절한 임베딩 모델 선택 (도메인, 언어, 성능)
  • Hybrid Search 적용 (BM25 + Dense)
  • Reranking 단계 추가
  • 출처 표시 (Citation) 구현
  • 평가 메트릭 설정 (Precision@k, MRR, NDCG)
  • A/B 테스트로 지속적 개선

Agent 시스템 구축 시

  • 명확한 도구(Tool) 정의 및 문서화
  • 에러 처리 및 재시도 로직
  • 무한 루프 방지 (최대 반복 횟수 설정)
  • 비용 모니터링 (토큰 사용량)
  • Human-in-the-loop 지점 설정
  • 로깅 및 추적 (Observability)
  • 보안 고려 (코드 실행, API 호출 권한)

Multimodal 시스템 구축 시

  • 이미지 전처리 (해상도, 포맷)
  • Modality 간 정렬 (Alignment) 품질
  • 적절한 프롬프팅 (Vision 모델 특성 고려)
  • 안전 필터링 (유해 이미지 생성 방지)
  • 비용 최적화 (Vision API는 일반적으로 비쌈)

9. 참고 자료

주요 프레임워크 & 라이브러리

LLM 오케스트레이션:

Vector DB:

Multimodal:

Agent Frameworks:

학습 자료

논문:

  • "Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks" (2020)
  • "Self-RAG: Learning to Retrieve, Generate, and Critique through Self-Reflection" (2023)
  • "Tree of Thoughts: Deliberate Problem Solving with Large Language Models" (2023)
  • "Reflexion: Language Agents with Verbal Reinforcement Learning" (2023)
  • "From Local to Global: A Graph RAG Approach" (Microsoft, 2024)

블로그 & 문서:


마치며

2026년 현재, LLM 시스템은 RAG, Agent, Multimodal, Advanced Retrieval 기법들의 통합을 통해 더욱 강력하고 실용적인 애플리케이션으로 진화하고 있습니다.

핵심 트렌드:
1. Long Context + RAG의 시너지: RAG는 사라지지 않고 정제된 형태로 진화
2. 멀티 에이전트 시스템의 부상: 복잡한 작업을 역할 분담으로 해결
3. Multimodal의 일상화: 텍스트만이 아닌 모든 형태의 정보 처리
4. 효율성과 성능의 균형: 작은 모델 + 똑똑한 전략

실무에서는 최신 알고리즘을 맹목적으로 따르기보다는, 문제의 본질을 파악하고 적절한 도구를 선택하는 것이 중요합니다. 간단한 RAG로 충분한 경우도 많고, 복잡한 멀티 에이전트가 필요한 경우도 있습니다.

지속적인 실험, 평가, 개선의 사이클을 통해 최적화된 LLM 시스템을 구축하시기 바랍니다!

profile
👩🏻‍💻

0개의 댓글