시리즈 「RAG 처음부터 고도화까지」 — 5부작. > 이 글은 1부. RAG가 뭔지, 어디서 성능이 결정되는지부터. 0. 왜 이 글을 쓰나 회사 안에서 RAG 시스템을 한 달 굴려보면 성능 차이가 어디서 나오는지 가 보입니다. 같은 LLM (Gemma·Qwen·GPT-4o) 을 써도, 누구는 RAGAS faithfulness 0.6 을 못 넘기고 누구는...
시리즈 「RAG 처음부터 고도화까지」 — 2부. > 1편: 개요 + 5개 축 을 먼저. 이번 글의 목표 5개 축 중 ① 청킹 + ② 임베딩 (Indexing 단계) 의 정교화. 이 두 축은 RAG 가 시작도 하기 전에 결정되는 부분이라, 잘못 잡으면 이후 모든 retrieval/reranker 가 회복 불가능한 손해를 봅니다. 다룰 것: 청킹 전략 ...
시리즈 「RAG 처음부터 고도화까지」 — 3부. > 1편 · 2편: Indexing 까지 본 상태. 이번 글의 목표 5축 중 ③ 검색 + ④ 재정렬 (Retrieval 단계) 의 정교화. 같은 임베딩, 같은 청크에서도 검색을 어떻게 하느냐 가 답변 품질을 다시 한 번 갈라놓습니다. 다룰 것: 쿼리 변환 — Multi-Query · HyDE · Ste...
시리즈 「RAG 처음부터 고도화까지」 — 4부. > 1편 · 2편 · 3편 까지 본 상태. 이번 글의 목표 5축 중 ⑤ 생성 의 정교화와, 이 모든 개선이 정말 효과 있는지 측정 하는 도구. 핵심 메시지: 검색 결과를 무조건 믿지 않는 RAG 가 운영 환경의 다음 단계입니다. 2026 년 트렌드: Self-RAG — LLM 이 검색 필요/충분 여부를...
시리즈 「RAG 처음부터 고도화까지」 — 5부. > 1편 · 2편 · 3편 · 4편 까지 본 상태. 이번 글의 목표 지금까지 한 모든 게 단발 RAG (질문 한 번 → 응답 한 번) 였습니다. 2026 년의 모던 아키텍처는 그 위 한 단계 — Agentic / Graph / Tree-summary 패턴. 다룰 것: Agentic RAG — LLM 이...
시리즈 「RAG 처음부터 고도화까지」 — 6부. > 1~5편 까지 본 상태. 이번 글의 목표 5편 마지막에서 Agentic RAG / ReAct 를 짧게 다뤘습니다. 이번 편은 그 위로 한 단계 — Tool-chain 설계, Multi-Agent 분리, Reflection (자기 비판), 메모리 (대화형) 까지. 운영에서 자주 부딪히는 질문들: Re...
시리즈 「RAG 처음부터 고도화까지」 — 7부. > 1~6편 까지 본 상태. 이번 글의 목표 연구 / PoC 가 아니라 운영에서 RAG 를 굴리는 데 필요한 것 들. 정확도 / 환각 얘기는 1~6편이었고, 이번은: 멀티모달 RAG — 표·차트·다이어그램 처리 (ColPali · VLM) 스트리밍 응답 — UX 개선 + 첫 토큰 latency Obser...