๐Ÿ‘ฉโ€๐ŸŽจ RAG

๊น€์ˆ˜์ง„ยท2026๋…„ 1์›” 18์ผ

RAG?

Retrieval-Augmented Generation(RAG) ์€ ๋Œ€๊ทœ๋ชจ ์–ธ์–ด ๋ชจ๋ธ์ด ๋‹ต๋ณ€์„ ์ƒ์„ฑํ•˜๊ธฐ ์ „์— ์™ธ๋ถ€ ์ง€์‹ ์ €์žฅ์†Œ์—์„œ ๊ด€๋ จ ์ •๋ณด๋ฅผ ๊ฒ€์ƒ‰ํ•˜์—ฌ, ๊ทธ ๊ฒฐ๊ณผ๋ฅผ ๋ฐ”ํƒ•์œผ๋กœ ๋‹ต๋ณ€์„ ์ƒ์„ฑํ•˜๋„๋ก ํ•˜๋Š” ๋ฐฉ์‹์ด๋‹ค.

๊ธฐ์กด์˜ ๋Œ€๊ทœ๋ชจ ์–ธ์–ด ๋ชจ๋ธ์€ ํ•™์Šต ์‹œ์ ๊นŒ์ง€์˜ ๋ฐ์ดํ„ฐ๋งŒ์„ ๊ธฐ๋ฐ˜์œผ๋กœ ๋™์ž‘ํ•œ๋‹ค. ์ด๋กœ ์ธํ•ด,

  • ์ตœ์‹  ์ •๋ณด๊ฐ€ ๋ฐ˜์˜๋˜์ง€ ์•Š๋Š”๋‹ค.
  • ๋ชจ๋ธ์ด ์•Œ์ง€ ๋ชปํ•˜๋Š” ๋‚ด์šฉ์— ๋Œ€ํ•ด ์‚ฌ์‹ค๊ณผ ๋‹ค๋ฅธ ๋‹ต๋ณ€์„ ์ƒ์„ฑํ•  ์ˆ˜ ์žˆ๋‹ค.
  • ๋‹ต๋ณ€์˜ ๊ทผ๊ฑฐ๋ฅผ ๋ช…ํ™•ํ•˜๊ฒŒ ์ œ์‹œํ•˜๊ธฐ ์–ด๋ ต๋‹ค.

RAG๋Š” ์ด๋Ÿฌํ•œ ํ•œ๊ณ„๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด, ์งˆ๋ฌธ์ด ๋“ค์–ด์˜ฌ ๋•Œ๋งˆ๋‹ค ์™ธ๋ถ€ ๋ฐ์ดํ„ฐ ์†Œ์Šค์—์„œ ๊ด€๋ จ ์ •๋ณด๋ฅผ ๊ฒ€์ƒ‰ํ•˜๊ณ  ์ด๋ฅผ ๋‹ต๋ณ€ ์ƒ์„ฑ ๊ณผ์ •์— ํฌํ•จํ•˜๋„๋ก ์„ค๊ณ„๋˜์—ˆ๋‹ค. ์ด๋กœ ์ธํ•ด ๋ชจ๋ธ์€ ๋” ์ •ํ™•ํ•˜๊ณ  ๊ฒ€์ฆ ๊ฐ€๋Šฅํ•œ ๋‹ต๋ณ€์„ ์ƒ์„ฑํ•  ์ˆ˜ ์žˆ๋‹ค.

๊ทธ๋ ‡๋‹ค๋ฉด ์–ด๋–ค์‹์œผ๋กœ RAG๊ฐ€ ๊ตฌ์„ฑ์ด ๋ ๊นŒ?

์ด ๊ทธ๋ฆผ์ด RAG๊ฐ€ ์ž‘๋™๋˜๋Š” ๋ฐฉ์‹์ด๋‹ค.

1. Prompt + Query ์ž…๋ ฅ ๋‹จ๊ณ„

์‚ฌ์šฉ์ž๊ฐ€ ์‹œ์Šคํ…œ์— ์งˆ๋ฌธ, ์ฆ‰ Query๋ฅผ ์ž…๋ ฅํ•œ๋‹ค.

์ด ๋‹จ๊ณ„์—์„œ๋Š” ์•„์ง ์™ธ๋ถ€ ์ง€์‹ ๊ฒ€์ƒ‰์ด ์ด๋ฃจ์–ด์ง€์ง€ ์•Š๋Š”๋‹ค.
RAG ์‹œ์Šคํ…œ์—์„œ ์ž…๋ ฅ์„ ๋ฐ›๋Š” ๋‹จ๊ณ„๋ผ๊ณ  ๋ณผ ์ˆ˜ ์žˆ๋‹ค.

2. Query๋ฅผ ์ด์šฉํ•œ ๊ด€๋ จ ์ •๋ณด ๊ฒ€์ƒ‰ ๋‹จ๊ณ„

์ž…๋ ฅ๋œ Query๋Š” ๊ณง๋ฐ”๋กœ LLM์œผ๋กœ ์ „๋‹ฌ๋˜์ง€ ์•Š๊ณ , Search Relevant Information ๋‹จ๊ณ„๋กœ ์ „๋‹ฌ๋œ๋‹ค.

์ด ๋‹จ๊ณ„์—์„œ๋Š” ์‚ฌ์šฉ์ž์˜ ์งˆ๋ฌธ์„ ๋ถ„์„ํ•œ๋‹ค.

์งˆ๋ฌธ๊ณผ ์˜๋ฏธ์ ์œผ๋กœ ๊ฐ€์žฅ ๊ด€๋ จ ์žˆ๋Š” ์ •๋ณด๋ฅผ ๋ฏธ๋ฆฌ ๊ตฌ์ถ•๋œ Knowledge Sources์—์„œ ์ฐพ๋Š”๋‹ค.

Knowledge Sources์—๋Š” PDF ๋ฌธ์„œ, ๋‚ด๋ถ€ ๊ทœ์ • ๋ฐ ๋งค๋‰ด์–ผ, ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค, ๋กœ๊ทธ, ๋ณด๊ณ ์„œ, ๊ธฐ์ˆ  ๋ฌธ์„œ ๋“ฑ์ด ์žˆ์„ ์ˆ˜ ์žˆ๋‹ค.

3. Enhanced Context ์ƒ์„ฑ์„ ์œ„ํ•œ ๊ด€๋ จ ์ •๋ณด ๋ฐ˜ํ™˜

๊ฒ€์ƒ‰ ๊ฒฐ๊ณผ๋กœ ์–ป์–ด์ง„ ๋ฌธ์„œ๋‚˜ ํ…์ŠคํŠธ๋Š” Relevant Information for Enhanced Context ๋กœ ํ‘œ์‹œ๋œ ๊ฒฝ๋กœ๋ฅผ ํ†ตํ•ด, ๋‹ค์‹œ ์• ํ”Œ๋ฆฌ์ผ€์ด์…˜์œผ๋กœ ์ „๋‹ฌ๋œ๋‹ค.

์ด ์ •๋ณด๋Š” ๊ทธ๋Œ€๋กœ ์‚ฌ์šฉ์ž์—๊ฒŒ ๋ณด์—ฌ์ง€์ง€ ์•Š๋Š” ์ฆ‰, LLM์ด ๋‹ต๋ณ€์„ ๋” ์ •ํ™•ํžˆ ์ƒ์„ฑํ•˜๋„๋ก ๋•๋Š” ๋ณด์กฐ ์ •๋ณด์ด๋‹ค.

์ด๋กœ ์ธํ•ด ๋ชจ๋ธ์€ ์‹ค์ œ ๋ฌธ์„œ์— ์กด์žฌํ•˜๋Š” ์ •๋ณด๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ๋‹ต๋ณ€ํ•  ์ˆ˜ ์žˆ๊ฒŒ ๋œ๋‹ค.

4. Prompt + Query + Enhanced Context ๊ตฌ์„ฑ ๋‹จ๊ณ„

์ด ๋‹จ๊ณ„์—์„œ RAG๊ฐ€ ์™„์„ฑ๋œ๋‹ค.

์• ํ”Œ๋ฆฌ์ผ€์ด์…˜์ด Prompt + ์‚ฌ์šฉ์ž Query + ๊ฒ€์ƒ‰์„ ํ†ตํ•ด ์–ป์€ Enhanced Context๋ฅผ ํ†ตํ•ฉํ•œ๋‹ค.
์ด๋ ‡๊ฒŒ ํ†ตํ•ฉ๋œ ์ •๋ณด๋Š” Large Language Model Endpoint ๋กœ ์ „๋‹ฌ๋œ๋‹ค.

์ฆ‰, LLM์€ ์ฒ˜์Œ๋ถ€ํ„ฐ ๋๊นŒ์ง€ ๋ชจ๋“  ์ •๋ณด๋ฅผ ์•Œ๊ณ  ์žˆ๋Š” ์ƒํƒœ์—์„œ
๋‹ต๋ณ€์„ ์ƒ์„ฑํ•˜๋Š” ๊ฒƒ์ด ์•„๋‹ˆ๋ผ, ๊ฒ€์ƒ‰์œผ๋กœ ๋ณด๊ฐ•๋œ ๋ฌธ๋งฅ์„ ์ฐธ๊ณ ํ•˜์—ฌ ๋‹ต๋ณ€์„ ์ƒ์„ฑํ•˜๊ฒŒ ๋œ๋‹ค.

5. Generated Text Response ์ƒ์„ฑ ๋‹จ๊ณ„

LLM์€ ์ „๋‹ฌ๋ฐ›์€ Prompt, Query, Enhanced Context๋ฅผ ์ข…ํ•ฉํ•˜์—ฌ
์ตœ์ข… ํ…์ŠคํŠธ ์‘๋‹ต์„ ์ƒ์„ฑํ•œ๋‹ค.

์ด๋ก ์จ, ๊ธฐ์กด LLM์˜ ๋‹จ์ ์ธ ํ—ˆ์œ„ ์ •๋ณด ์ƒ์„ฑ ๊ฐ€๋Šฅ์„ฑ์ด ๋‚ฎ๋‹ค. ๋˜ํ•œ, ๋‚ด๋ถ€ ๋ฌธ์„œ๋‚˜ ์ตœ์‹  ์ •๋ณด๊ฐ€ ๋ฐ˜์˜๋  ์ˆ˜ ์žˆ๋‹ค. ์ถœ์ฒ˜ ๊ธฐ๋ฐ˜ ๋‹ต๋ณ€๋„ ๊ฐ€๋Šฅํ•˜๋‹ค.

0๊ฐœ์˜ ๋Œ“๊ธ€