๐ Overview
ย ์ต๊ทผ ๋ฐ๋ธ์ฝ์ค ๋จ๊ธฐ ์ฌํ ๊ณผ์ ์ ์๋ฃํ๋ฉฐ ์ฌ๋ฌ ์๋ก์ด ๊ธฐ์ ๋ค๊ณผ ๊ฐ๋
๋ค์ ํ์ตํ๊ณ ์๋ค. ์ฝ ํ ๋ฌ ์ฌ์ ๊ธฐ๊ฐ ๋์ ์นดํ์นด๋ฅผ ๋น๋กฏํด DDD(ํฅ์ฌ๊ณ ๋ ์ํคํ
์ณ) ์ MSA, ์คํ๋ง ๋ฐฐ์น, ์๋ผ์คํฑ ์์น ๋ฑ์ ๊ฐ๋
๋ค์ ๋ฐฐ์ฐ๊ณ ์ค์ต์ ์งํํ๋ค.
ย ํ์ฌ๋ ์ด๋ฌํ ๊ธฐ์ ๋ค์ ์ ์ฉํ ์๋ก์ด ํ๋ก์ ํธ๋ฅผ ์งํํ๊ณ ์์ผ๋ฉฐ, ํ์๋ ํ์ฌ ์ด ์ค ์นดํ์นด, ์๋ผ์คํฑ ์์น๋ฅผ ์ฌ์ฉํ๊ณ ์๋ค. ์ดํ MS ๋ถ๋ฆฌ ๋ฐ ํฅ์ฌ๊ณ ๋ ์ํคํ
์ณ๋ก ๋ง์ด๊ทธ๋ ์ด์
์ ์งํํ ์์ ์ด๋ค.
ย 1์ฐจ ์คํ๋ฆฐํธ๊ฐ ์ข
๋ฃ๋๊ณ ์๋ก์ด ๊ฐ๋
์ ์ถ๊ฐ๋ก ๋ฐฐ์ ๋๋ฐ, ํด๋น ๋ด์ฉ์ด ๋ฐ๋ก AI ๋ฐ LLM๊ณผ RAG์ ๊ดํ ๋ด์ฉ์ด๋ค. ์ด ์ง์๋ค์ ๊ธฐ๋ฐ์ผ๋ก ํ๋ก์ ํธ์ AI ๊ธฐ๋ฅ์ ์ถ๊ฐํด๋๊ฐ ์์ ์ด๋ค.
ย ์ํ ํ๊ฒ ํ๋ก๊ทธ๋จ์์ ํด๋น ๊ธฐ๋ฅ์ ์ถ๊ฐํ๊ธฐ ์ํด์๋ ๋น์ฐํ, ์ ์ฉํ๋ ค๋ AI์ ๋ํ ๊ฐ๋
์ด ํ์คํ๊ฒ ์กํ์์ด์ผ ํ๋ค. ๊ฐ์๋ฅผ ํตํด ๋ฐฐ์ด ๋ด์ฉ์ ํ ๋๋ก, ํด๋น ๊ฐ๋
์ ์ ๋ฆฌํด๋๊ธฐ๋ก ๊ฒฐ์ ํ๋ค.
๐ค ์ธ๊ณต ์ง๋ฅ
1. ์ฝ ์ธ๊ณต์ง๋ฅ
- ํน์ ํ ์์
์ ์ํํ ์ ์๋๋ก ์ค๊ณ๋์ด ์๋ AI
- ChatGPT, ์คํธ ํํฐ๋ง, ์ผ๊ตด ์ธ์, ์ฒด์ค ๋ฐ๋ ๋ฑ
- ๋ฒ์๋ฅผ ๋ฒ์ด๋๋ฉด ์์
์ํ ๋ถ๊ฐ๋ฅ
2. ๊ฐ ์ธ๊ณต์ง๋ฅ
- ์ฌ๋์ด ๊ฐ์ง ์ ์๋ ์ง๋ฅ, ์ง์ฑ ๋ฑ์ ์ปดํจํฐ์ ์ ๋ณด์ฒ๋ฆฌ ๋ฅ๋ ฅ์ผ๋ก ๊ตฌํํ ์์คํ
- ์ฌ๋์ฒ๋ผ ๋ค์ํ ๋ฒ์์ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ ์ ์๋ ๋ฒ์ฉ AI
- ์์ง ๊ตฌํ๋์ง ์์ ๊ธฐ์
- ํ์ฌ๋ ์ด๋ก ์ ์ผ๋ก๋ง ์กด์ฌ
- ์์ง ์ฐ๊ตฌ ๋จ๊ณ
๐ชง AI์ ์๋ ๋ฐฉ์
1. ๊ท์น ๊ธฐ๋ฐ AI
- ์ฌ๋์ด ๋ช
์์ ์ผ๋ก ์ ์ํ ๊ท์น์ ๋ฐ๋ผ ์๋ํ๋ AI
- ex) ๋์ด์ ๋ฐ๋ฅธ ํ ์ธ ์ ์ฉ
- ์์ธก ๊ฐ๋ฅํ ๋ฒ์ ๋ด์์ ๋ช
ํํ๊ณ ์ ํํ ๊ฒฐ๊ณผ ์ ๊ณต
- ์์ธก์ ๋ฒ์ด๋ ๊ฒฝ์ฐ, ์ด๋ฌํ ๊ฒ๋ค์ด ์ด๋ ค์
2. ํ์ต ๊ธฐ๋ฐ AI
- ๋ฐ์ดํฐ๋ก๋ถํฐ ์ค์ค๋ก ํ์ตํ๋ AI
- ํจํด์ ์ฐพ์๋
- ex) ChatGPT ๊ฐ์ ์์ฑํ AI
- ๊ต์ฅํ ๋ง์ ๋ฐ์ดํฐ๋ฅผ ํ์๋ก ํ๋ฉฐ, ์ด๋ฅผ ์ฒ๋ฆฌํ๊ณ ํ์ตํด์ผ ํ๊ธฐ ๋๋ฌธ์ ๋ฌผ๋ฆฌ์ ์ธ ๋ฆฌ์์ค ๋ง์ด ์ฌ์ฉ
3. ๋จธ์ ๋ฌ๋
- ๋ฐ์ดํฐ์์ ํจํด์ ํ์ตํ์ฌ ๋ช
์์ ๊ท์น ์์ด ์ค์ค๋ก ์์ธก/๋ถ๋ฅ ๋ฑ์ ์ํํ๋ ๋ชจ๋ธ
- ํ
์คํธ ๋ถ๋ฅ, ์ด๋ฏธ์ง ๋ถ๋ฅ, ์์ธก ๋ชจ๋ธ, ์ถ์ฒ ์์คํ
๋ฑ ๋ค์ํ ํจํด ํ์ต ๋ฌธ์ ๋ฅผ ํด๊ฒฐ
- ex) ํค์๋ ์ถ์ถ
- ์ ํด์ง ํจํด์ ๋ฐ๋ผ ํค์๋๋ฅผ ์ถ์ถ
- ๊ฒฐ๊ณผ๋ฅผ ๋์ด
- ์ ๋ณด๋ฅผ ์ ๋ฌํด์ฃผ๊ธฐ๋ง ํจ
4. ์์ฑํ AI
- ์ง๋ฌธ์ ๋ํ ๋๋ต์ ๋์ด์์ ๋งฅ๋ฝ์ ์ดํดํ๊ณ ๋ถ์ฐ ์ค๋ช
์ ์ถ๊ฐ
- ๋จธ์ ๋ฌ๋ ์ค์์๋ ์๋ก์ด ๋ฐ์ดํฐ๋ฅผ ์์ฑํ๋ ๋ชจ๋ธ์ ์ํ๋ ๋ถ์ผ
5. ์ ํต์ AI vs ์์ฑํ AI
1๏ธโฃ ์ ํต์ AI
- ๋ถ์์ ํตํด ์ผ์ด๋ ์ผ์ ์์ธก
- ํน์ ์์
์ ์ํด์ ํ๋ จ์ด ๋์ด์์ผ๋ฏ๋ก, ๊ทธ ์์
์ ๋ํ ์ํ๋ง ๊ฐ๋ฅ
- ๋ค๋ฅธ ์์
์ ์ํด์๋ ๋ฐ๋์ ํด๋น ์์
์ ๋ํ ํ๋ จ์ด ๋ค์ ํ์
- ์
๋ ฅ ๊ตฌ์กฐ๊ฐ ๊ณ ์
- ex) ์ ํํ๋ ๋ฐ์ดํฐ, ํน์ ํฌ๋งท์ ์ด๋ฏธ์ง
- ์์ฐ์ด์ฒ๋ผ ์์ ๋ก์ด ์
๋ ฅ์ ์ง์ ๋ค๋ฃจ๋ ๊ฑด ๋ถ๊ฐ๋ฅ
2๏ธโฃ ์์ฑํ AI
- ์กด์ฌํ์ง ์๋ ํ
์คํธ, ์ด๋ฏธ์ง ๋ฑ์ ์์ฑ ๊ฐ๋ฅ
- ํ๋์ ๋ชจ๋ธ๋ง์ผ๋ก ์ง๋ฌธ, ๋ต๋ณ, ์์ฝ, ๋ต๋ณ, ์ฝ๋ ์์ฑ ๋ฑ ๋ค์ํ ์์
๊ฐ๋ฅ
- ์์ฐ์ด๋ก ๊ตฌ์ฑ๋ ๋ฌธ์ฅ๋ง์ผ๋ก ์์
์ ์ํ ๊ฐ๋ฅ
๐ฆ LLM(Large Language Model)
1. LLM์ ๊ธฐ๋ณธ ์๋ฆฌ
- ๋๊ท๋ชจ ์ธ์ด ๋ชจ๋ธ
- ํ์ต์ ์ฌ์ฉํ ๋ฐ์ดํฐ์ ํจํด, ํต๊ณ์ ๊ด๊ณ๋ฅผ ๋ฐํ์ผ๋ก ๋ค์ ๋จ์ด๋ฅผ ์์ธก
- ํฌ๊ฒ 2๊ฐ์ง์ ํ์ต ๋จ๊ณ๋ก ๊ตฌ๋ถ
- ๊ทธ ์ธ ๋ค์ํ ๋จ๊ณ๋ค๋ ์กด์ฌ
- ํ๋์ ๋ฌธ์ฅ์ ์ฌ๋ฌ ๊ฐ์ ํ ํฐ์ผ๋ก ๋ถ๋ฆฌ (ํ ํฌ๋์ด์ง)
- ๊ฐ๊ฐ์ ํ ํฐ์ ๊ณ ์ ํ ID๋ก ๋ณํ
- Attention Mechanism โ ์ด๋ค ๋ฌธ์ฅ์ด ์ฃผ์ด์ก์ ๋ ํ ํฐ ๊ฐ ๊ด๊ณ๋ฅผ ํ์
ํ์ฌ ๋ฌธ๋งฅ์ ํ์
- Temperature ๊ฐ์ด ๋ฎ์ผ๋ฉด ํ ํฐ ๋ค์ ๊ฐ์ด ํ๋ฅ ์ด ๋ฎ์ผ๋ฉด ํฌํจํ์ง ์๊ณ , ๋์ผ๋ฉด ํ ํฐ ๋ค์ ๊ฐ์ ํ๋ฅ ์ด ๋ฎ์๋ ํฌํจ
- ex) OpenAI Default โ 0.8
- ํ๋ฅ ์ ํตํ ๋๋ต ์์ฑ์ ์ํ
2. LLM์ ํ์ต ๋จ๊ณ
1๏ธโฃ ์ฌ์ ํ์ต
- ์น ํ์ด์ง, ๋
ผ๋ฌธ,๊ณต๊ฐ๋ ์ฝ๋ ๋ฑ ํ
์คํธ ๋ฐ์ดํฐ ํ์ฉ
- ๋ค์ ๋ฐ์ดํฐ ์์ธก ๊ณผ์ ์ ๊ณต
- ๋ง์ ์ปดํจํ
์์ ํ์
- ๋ชจ๋ธ์ด ์ปค์ง์๋ก ์์ฒ ๋ฐ์ดํฐ ์๋ ์ฆ๊ฐ
- ๋ฐ์ดํฐ ์ค์๋ ๋ถ์ ํํ ์ ๋ณด๋ ํฌํจ
- ๋ฐ์ดํฐ ๊ท๋ชจ๊ฐ ์ปค์ง๋ฉด์ ์ค๋ฅ๊ฐ ํฌํจ๋ ๊ฐ๋ฅ์ฑ ๋ํ ์กด์ฌ
2๏ธโฃ ๋ฏธ์ธ ์กฐ์
- ์ฌ์ ํ์ต ์ดํ ๋ค์ ํ ๋ฒ ํ์ต์ํค๋ ๊ณผ์
- ๊ฐํ ํ์ต (RLHF - Reignforcement Learning Human Feedback) ์ดํ ์ด๋ฅผ ๋ฐ์ํด ๋ฏธ์ธ ์กฐ์
3. LLM์ ๊ตฌ์กฐ์ ํ๊ณ
- LLM์ ์ ํํ ์ ๋ณด๋ฅผ ์ ์ฅํ๊ณ ๊ฒ์ํ์ง ์๊ณ , ํต๊ณ์ ์ผ๋ก ๊ฐ์ฅ ๊ทธ๋ด๋ฏํ ๋ฌธ์ฅ์ ๋ง๋ค์ด๋ด๋ ์์คํ
- ์ข์ ์ฑ๋ฅ๊ณผ ๋์์ ๊ทผ๋ณธ์ ์ธ ํ๊ณ์ ์กด์ฌ
- ์ด๋ฅผ ํ๊ฐ(Hallucination) ํจ๊ณผ๋ผ๊ณ ํจ
๐๏ธ ํ๊ฐ(Hallucination)
1. ํ๊ฐ(Hallucination)
- LLM์ด ์ฌ์ค์ด ์๋ ์ ๋ณด๋ฅผ ๋ง์น ์ฌ์ค์ธ ์ ์์ ์๊ฒ ํฌํจ์ํค๋ ๊ฒ
- LLM์ ์ง๋ฌธ์ ๋ฐ์ผ๋ฉด ํญ์ ๋ฌด์ธ๊ฐ๋ฅผ ์์ฑ
- ํ์ตํ๋ ํจํด์ ์กฐํฉํ์ฌ ๊ทธ๋ด๋ฏํ ๋๋ต์ ์์ฑ
- ํ์ง๋ง ์ฌ์ค ์ฌ๋ถ๋ฅผ ํ๋จํ์ง๋ ์์ผ๋ฏ๋ก ์ ํํ์ง ์์ ์ ๋ณด ํฌํจ ๊ฐ๋ฅ
- ๋ํ LLM์ ๋ณธ์ธ์ด ํ์ตํ ์์ ๊น์ง์ ๋ฐ์ดํฐ๋ง์ ๊ฐ์ง๊ณ ์์
- ๋ชจ๋ฅด๋ ์ ๋ณด์ ๊ฒฝ์ฐ, ๋ชจ๋ฅธ๋ค๊ณ ์ด์ผ๊ธฐํ์ง ์๊ณ ์๋ ์ง์์ ์กฐํฉ์ ํตํด ๋๋ต์ ์์ฑ
- ์ด๋ก ์ธํด ์๋น์๋ ์ ํํ์ง ์์ ์ ๋ณด๋ฅผ ์ ํํ ์ ๋ณด์ธ ์ ์ ๋ฌ ๋ฐ๋ ๊ฒฝ์ฐ๊ฐ ์์
- ๋ฒ์ ์ด ์ฌ๋ผ๊ฐ๋ฉด์ ์๋ ์ ๋ณด๋ ๊ฒ์์ ํด๋ณด๊ธฐ ๋๋ฌธ์, ๋น๊ต์ ์ ์ ํ ๋ฃจ์๋ค์ด์
ํจ๊ณผ ๋ฐ์ (์์ ๋ฐ์ํ์ง ์์ง๋ ์์)
- Temperature ๊ฐ์ด ๋์์๋ก ์ด๋ฌํ ํ๊ฐ ํจ๊ณผ๊ฐ ๋ ์์ฃผ ๋ฐ์
- ๋งฅ๋ฝ์ ์ ํ์ด ์กด์ฌํ ๊ฒฝ์ฐ์๋ ๋ฐ์
- ์๋์ฐ ๊ธธ์ด์ ํ๊ณ๊ฐ ์๊ธฐ ๋๋ฌธ์ ์ด ๊ฒฝ์ฐ ์คํด ๋ฐ์
- ํ์ต ๋ฐ์ดํฐ์ ํธํฅ๊ณผ ์ค๋ฅ๊ฐ ์กด์ฌํ๊ธฐ ๋๋ฌธ์, ์ด๋ก ์ธํด ํ๊ฐ ๋ฐ์
- ์๋์ ์ผ๋ก ์๊ณก๋ ๋ฐ์ดํฐ๋ ์กด์ฌํ๋ฏ๋ก ์ํ์ฑ ๋ํ ์กด์ฌ
- ๊ธฐ์ ์ ์ธ ๋ฉด์์ ๋ํ ์ด๋ฐ ํ ๋ฃจ์๋ค์ด์
ํ์์ด ์กด์ฌ
- ์กด์ฌํ์ง๋ ์๋ ๋ผ์ด๋ธ๋ฌ๋ฆฌ ์ํฌํธ
- ๊ทธ ์ธ ์กด์ฌํ์ง ์๊ฑฐ๋ Deprecated๋ ํด๋์ค, ๋ฉ์๋, ์๋ชป๋ ์ค๋ฒ๋ผ์ด๋ฉ ๋ฑ
- ์ต์ ๋ฒ์ ์ผ **๊ฒฝ์ฐ ๋ชจ๋ธ์ด ์์ง ํ์ตํ์ง ๋ชปํ์** ๊ฐ๋ฅ์ฑ์ด ์์ผ๋ฏ๋ก, ๋ ์์ฃผ ๋ฐ์
- ์ด๋ฌํ ํ๊ฐ ํจ๊ณผ๋ LLM์ ๊ตฌ์กฐ์ ์ธ ์ํฅ์ด๋ฏ๋ก ์์ ํ ์์จ ์๋ ์์
- ์ด๋ฅผ ์ค์ฌ๊ฐ๋ ๊ฒ์ด ์ต์ ์ฑ
2. Hallucination ๊ฐ์ ๋ฐฉ๋ฒ
- ๊ตฌ์ฒด์ ์ธ ํ๋กฌํํธ ์ ๊ณต
-
ex)
Spring Boot 3.4 ๋ฒ์ ์์,
RestTemplate ๋์ WebClient๋ฅผ ์ฌ์ฉํ๋ ๋ฐฉ๋ฒ์ ์์ ์ฝ๋์ ํจ๊ป ์ค๋ช
ํด์ค.
๋ชจ๋ฅด๋ฉด ๋ชจ๋ฅธ๋ค๊ณ ๋๋ตํ๊ณ , ์ถ์ธกํ์ง ๋ง๊ณ ํ์คํ ์ ๋ณด๋ง ์ ๊ณตํด
- RAG (Retrieval Augmented Generation)
- ๊ฒ์๊ณผ ์์ฑ์ ๊ฒฐํฉํ ์ ๊ทผ ๋ฐฉ๋ฒ
- ์ ์ ํ Temperature ์์ฑ
- Temperature๊ฐ ๋์์๋ก ํ ๋ฃจ์๋ค์ด์
ํจ๊ณผ ๋ฐ์ ํ๋ฅ ์ฆ๊ฐ
- ๊ทธ๋ฌ๋ฏ๋ก, ์ ์ ํ Temperature ์ค์ ์ด ์ค์
- ex) ์ฌ์ค์ ์ ๋ณด๊ฐ ์ค์ํ๋ฉด Temperature ๊ฐ์ ๊ฐ์
๐ฉ ํ๋กฌํํธ ์์ง๋์ด๋ง
1. ํ๋กฌํํธ ์์ง๋์ด๋ง
- ํ๋กฌํํธ๋ฅผ ์ค๊ณํ๊ณ ์ต์ ํํ๋ ๊ณผ์
- ํ๋กฌํํธ โ ์ํ๋ ๊ฒฐ๊ณผ๋ฅผ ์ป๊ธฐ ์ํด์ ์
๋ ฅํ๋ ํ
์คํธ
- ์ด๋ ๊ฒ ์ต์ ํํ ํ๋กฌํํธ๋ฅผ ํตํด ์ํ๊ณ ์ ํ๋ ๋ณด๋ค ์ ํํ ๊ฒฐ๊ณผ๋ฅผ ์ป๊ณ ์ ํ๋ ๊ฒ
2. ํ๋กฌํํธ ์์ง๋์ด๋ง์ 3์์น
- ํ๋กฌํํธ ์์ง๋์ด๋ง์ ๊ธฐ๋ณธ ์์น์ ํฌ๊ฒ 3๊ฐ์ง๊ฐ ์กด์ฌ
1๏ธโฃ ๋ช
ํ์ฑ
- ํ๋กฌํํธ๋ฅผ ์์ฑํ ๊ฑฐ๋ฉด ๋ชจํธํ ํํ์ ํผํ๊ณ ์ํ๋ ํํ์ ๊ตฌ์ฒด์ ์ผ๋ก ์์ฑ
2๏ธโฃ ๋งฅ๋ฝ ์ ๊ณต
- LLM์ด ํ์ํ ์ ๋ณด์ ๋งฅ๋ฝ์ ์ถฉ๋ถํ ์ ๊ณตํด์ผ ํจ
3๏ธโฃ ๊ตฌ์ฒดํ
- ๋ณต์กํ ์์
์ ๊ฒฝ์ฐ ๋จ๊ณ๋ณ๋ก ๋๋๊ฑฐ๋ ์ ํํ ์ ๋ณด๋ฅผ ์ ๊ณตํด์ผ ํจ
3. ํ๋กฌํํธ ํ
ํ๋ฆฟ
- ๋ฏธ๋ฆฌ ์ ์๋ ํ๋กฌํํธ์ ๋ณ์๋ฅผ ๋ฃ์ ์ ์๋๋ก ๋ง๋ค์ด๋ ํ
- ์ด๋ฅผ ํตํด ๊ฒ์ฆ๋ ํ๋กฌํํธ๋ฅผ ํ์คํ
- ex1)

- ex2)

- ํฌ๊ฒ 4๊ฐ์ง ์ธ์
์ผ๋ก ๊ตฌ์ฑ
1๏ธโฃ System Message
- LLM์ ์ญํ ๋ฐ ๊ธฐ๋ณธ ๋์ ๋ฐฉ์ ์ ์
2๏ธโฃ Context
- ๋๋ฉ์ธ ํนํ ์ ๋ณด
- ๊ฒ์๋ ๋ฌธ์์ ๋ด์ฉ
- ์ฌ์ฉ์ ์
๋ ฅ ์ธ์
- ์ฌ์ฉ์์ ์ง๋ฌธ ๋ฐ ์์ฒญ ํฌํจ
4๏ธโฃ Instructions
ํน์ Instructions์ Output Format์ ๋ถ๋ฆฌ ๊ฐ๋ฅ
4. ํ๋กฌํํธ ํ
ํ๋ฆฟ ์ฃผ์์ฌํญ
- ๋ณ์ ์ฃผ์
- ํ๋กฌํํธ ์ธ์ ์
์ ๊ณ ๋ ค
- ํ๋กฌํํธ ์ธ์ ์
โ ์
์์ ์ธ ์ฌ์ฉ์๊ฐ ์์คํ
์ง์์ฌํญ์ ๋ฌด์ํ๊ฑฐ๋ ๋ณ๊ฒฝ์ํค๋ ๊ฒ
- ํ ํฐ ์ ํ
- LLM์ด ์ฒ๋ฆฌํ ์ ์๋ ํ ํฐ์ ์ด๋
- ํ ํฐ์ ์ ํํ์ฌ ์๊ฐ๋น ์ฌ์ฉํ ์ ์๋ ํ ํฐ ๊ฐ์ ๋ถ์ฌ
- ๋ฌธ์ฅ์ด ๊ธธ์๋ก ํ ํฐ ์ฌ์ฉ๋ ์ฆ๊ฐ
- ํ
ํ๋ฆฟ ๊ด๋ฆฌ (=๋ฒ์ ๊ด๋ฆฌ)
- ํ๋กฌํํธ๋ฅผ ๊ด๋ฆฌํ ์ ์๊ณ ๋ณ๊ฒฝ ์ด๋ ฅ์ ์ถ์ ํ ์ ์๋๋ก ์ค๊ณ
- ํ
ํ๋ฆฟ์ ๋ณ์ ์ง์ ๋ฐ ๋ฐํ์ ์์ ์ ์ค์ ๊ฐ์ ๋ฐ์ธ๋ฉ
๐ RAG(Retrieval Argmented Generation)
1. RAG
- ๊ฒ์ ์ฆ๊ฐ ์์ฑ (Retrieval Argmented Generation)
- LLM์ด ๋ต๋ณ์ ์์ฑํ๊ธฐ ์ ์ ๋จผ์ ๊ฒ์๊ณผ ์๋ฃ๋ฅผ ์ฐธ๊ณ ํ๊ณ , ๊ทธ ์ดํ ๋ต๋ณ์ ์์ฑ
- LLM์ ํ๊ณ์ ์ด ์กด์ฌ
- ํ์ต ์์ ๋ฐ์ดํฐ ํ์ฉ
- ๋น๊ณต๊ฐ ์ ๋ณด ํ์ฉ ๋ถ๊ฐ
- ์ ๋ฌธ ๋๋ฉ์ธ ์ง์ ๋ถ์ฌ
- ๋ชจ๋ธ ํ์ต์ ์๊ตฌ ๋น์ฉ
- ๋ชจ๋ธ ์์ฒด๋ฅผ ์ฌํ์ต์ํค์ง ์๊ณ ๋ ์ธ๋ถ ์ง์์ ํ์ฉํ ์ ์๋ ๋ฐฉ๋ฒ
- ์ฌ์ฉ์ ์ง๋ฌธ โ ๊ด๋ จ ๋ฌธ์ ๋ฐ ์ ๋ณด ๊ฒ์ โ ํ๋กฌํํธ์ ํฌํจ โ LLM์ ์ ๋ฌ
- ์ด๋ฅผ ํตํด ํ๊ฐ ํจ๊ณผ๋ฅผ ํฌ๊ฒ ๊ฐ์
- ์ ๋ขฐํ ์ ์๋ ๊ฒฐ๊ณผ ์ ๊ณต
- ๋ฌผ๋ก ํ๊ฐ ํจ๊ณผ๋ฅผ ์์ ํ ์์ ๋ ๊ฒ์ ํ์ฌ๋ก์ ๋ถ๊ฐ๋ฅ
2. RAG ๋จ๊ณ๋
- ์ค๋น ๋จ๊ณ (Indexing)
- ์๋ฒ ๋ฉ์ ํตํด ๋ฐ์ดํฐ๋ฅผ ๋ฒกํฐ๋ก ๋ณํ
- ๋ฒกํฐ๋ ๋ฒกํฐ DB์ ์ ์ฅ
- ๊ฒ์ (Retrieval)
- ๋ฒกํฐ DB์ ๋ฒกํฐ์ ์ ์ฌํ ๋ฌธ์๋ฅผ ๊ฒ์
- ์ ์ฌ๋๊ฐ ๋์ ๋ช ๋ฌธ์๋ค์ Chunk๋ก ๊ฐ์ ธ์ด
- ์์ฑ ์์ ๊ทผ๊ฑฐ ์๋ฃ
- ์์ฑ (Creation)
- ์ด์ ์ Chunk๋ค์ ๊ธฐ๋ฐ์ผ๋ก ๋ต๋ณ์ ์์ฑ
3. ๋ฒกํฐ ์ ์ฅ์
- ํ
์คํธ๋ฅผ ์๋ฒ ๋ฉ ๋ฒกํฐ๋ก ๋ณํํ์ฌ ์ ์ฅํ๊ณ , ํ์ํ ๋ ์๋ฏธ์ ์ผ๋ก ์ ์ฌํ ๋ฐ์ดํฐ๋ฅผ ๋น ๋ฅด๊ฒ ๊ฒ์ํ ์ ์๋๋ก ๋์์ฃผ๋ ์ ์ฅ์
- ๊ณ ์ฐจ์ ๊ณต๊ฐ์ ๋ฐฐ์น๋ ๋ฒกํฐ ๊ฐ ๊ฑฐ๋ฆฌ๋ฅผ ๊ณ์ฐํ์ฌ ์๋ฏธ์ ์ผ๋ก ๊ฐ๊น์ด ์ ๋ณด ํ๋
- ex) Pincone, Weaviate, Chroma
- ์ผ๋ฐ์ ์ธ RDB๋ก๋ ๋ฒกํฐ ์ ์ฅ์ ํจ์จ์ ์ผ๋ก ํ๊ธฐ ์ด๋ ค์
- ์ ์ฌ๋ ๊ธฐ๋ฐ์ผ๋ก ๋น ๋ฅด๊ฒ ๊ฒ์ฌํ๊ธฐ ์ด๋ ค์
4. ์ฒญํน
- ๊ธด ๋ฌธ์๋ฅผ ์์ ์กฐ๊ฐ์ผ๋ก ๋๋๋ ๊ณผ์
- ์๋ฒ ๋ฉ ๋ชจ๋ธ์๋ ํ ํฐ ์ ํ์ด ์์ผ๋ฏ๋ก, ๋๋ ์ ์ฒ๋ฆฌํ ํ์๊ฐ ์์
- ์น์
๋ณ๋ก ๋๋ ์ ์๋ฒ ๋ฉ ํ ์ ๊ฐ ์ธ์
์ ๊ตฌ์ฒด์ ์ธ ๋ด์ฉ์ด ๋น๊ต์ ์ ๋๋ฌ๋ ์ ์์
- ๊ณ ์ ๊ธธ์ด ๋ฐฉ์
- ๋ช ๊ธ์๋ง๋ค ์๋ผ์ ์ฒญํฌ๋ฅผ ๋๋๋ ๋ฐฉ์
- ๋ฌธ๋จ์ด๋ ๋ฌธ์ฅ์ ๊ฒฝ๊ณ๋ฅผ ๋ฌด์
- ๋ฌธ๋งฅ์ ๋ฌธ์ ๊ฐ ๋ฐ์ํ ์ ์์ผ๋ฏ๋ก, ์๋ฒ ๋ฉ ์ ์ํ๋ ๊ฒฐ๊ณผ๊ฐ ๋ด๊ธฐ์ง ์์ ํ๋ฅ ์กด์ฌ
- ๋ฌธ์ฅ/๋ฌธ๋จ ๊ฒฝ๊ณ ๋ฐฉ์
- ์์ฐ์ค๋ฌ์ด ๋จ์๋ก ์ฒญํฌ๋ฅผ ๋๋๋ ๋ฐฉ์
- ์์ฐ์ค๋ฌ์ด ๋ฌธ๋งฅ์ ๊ณ ๋ คํ์ฌ ์๋ฒ ๋ฉํ๋ฏ๋ก, ๋น๊ต์ ์ ๊ตํ ๊ฒฐ๊ณผ ์ ๊ณต
- ์ฒญํฌ๋ฅผ ์ผ์ ๋ถ๋ถ ๊ฒน์น๊ฒ ๋ง๋ค๋ฉด(Overwrap), ๋ฌธ๋งฅ ์ค์น ๋ฐฉ์ง ๊ฐ๋ฅ
- 200 ~ 500 ํ ํฐ ์ ๋ ์ค๋ฒ๋ฉ์ด ์ ๋นํ๋ค๊ณ ์๋ ค์ ธ๋ ์์ผ๋, ๋น์ฆ๋์ค๋ง๋ค ๋ฌ๋ผ์ง ์ ์์
๐พ ์๋ฒ ๋ฉ(Embedding)
1. ์๋ฒ ๋ฉ(Embedding)
-
ํ
์คํธ ๋ฐ์ดํฐ๋ฅผ ๊ณ ์ฐจ์ ๋ฒกํฐ๋ก ๋ณํ
- ๋จ์ด๋ ๋ฌธ์ฅ์ ์๋ฏธ๋ฅผ ์ซ์๋ก ๋ณํ
- ๋ฒกํฐ๋ ๊ฐ๋ตํ๊ฒ, ์ฌ๋ฌ ๊ฐ์ ์ซ์๋ก ์ด๋ฃจ์ด์ง ๋ฐฐ์ด ์ ๋ณด
-
์๋ฏธ๊ฐ ๋น์ทํ ๋จ์ด๋ค์ ๋น๊ต์ ๋น์ทํ ๋ฒกํฐ๋ก ์นํ
- ์ด ๋ฒกํฐ ๊ฐ์ ๊ฑฐ๋ฆฌ๋ฅผ ํตํด ๋จ์ด ๊ฐ์ ์ ์ฌ๋ ์ธก์ ๊ฐ๋ฅ
-
์๋ฒ ๋ฉ์ ๋ฅ๋ฌ๋ ๋ชจ๋ธ์ ํตํด ํ์ต
-
์๋ฒ ๋ฉ ์ถ๋ก ์์
![์
๋ก๋์ค..]()
-
์ด๋ฌํ ๋ฒกํฐ ๊ฐ๋ค์ ํตํด ์ ์ฌ๋ ๊ฒ์์ ์งํ ๊ฐ๋ฅ
-
์ ์ฌ๋ ๋ณด์กด
- ๋จ์ด ๊ฐ์ ์๋ฏธ ๊ด๊ณ๋ฅผ ๋ฒกํฐ ๊ณต๊ฐ์์ ๊ทผ์ฌ์ ์ผ๋ก ๋ณด์กด
-
๋ฌธ๋งฅ ์์กด์ฑ
- ๊ฐ์ ๋จ์ด๋ ๋ฌธ๋งฅ์ ๋ฐ๋ผ ๋ค๋ฅธ ๋ฒกํฐ๋ฅผ ๊ฐ์ง ์ ์์
- ex) ๊ณผ์ผ ์ฌ๊ณผ / ์๋ชป์ด๋ผ๋ ์๋ฏธ์ ์ฌ๊ณผ
-
๋ค๊ตญ์ด ์ง์
- ์ฌ๋ฌ ์ธ์ผ์ ๋จ์ด๋ค์ ๋์ผํ ๋จ์ด๋ก ์ทจ๊ธ ๊ฐ๋ฅ
-
๊ด๊ณ ํํ ๋ฅ๋ ฅ
- ์๋ฒ ๋ฉ ๋ ๋จ์ด ๊ฐ์ ์ฐ์ ์ฐ์ฐ์ด ๊ฐ๋ฅ
- ์ด๋ก ์ธํ ๋จ์ด๋ค์ ๊ด๊ณ ํํ๋ ๊ฐ๋ฅ
-
๋ถ๋ณ์ฑ
- ์งง๋ ๊ธธ๋ , ์๋ฒ ๋ฉ ๊ฒฐ๊ณผ๋ ๋ชจ๋ธ์ด ํํ ๊ฐ๋ฅํ ๊ฐ์ ์ฐจ์์ ๋ฒกํฐ๋ก ์ฐจ์์ ๋ฒกํฐ๋ก ์นํ
- 1๊ฐ์ ๋จ์ด๋ 100๊ฐ์ ๋จ์ด๋ ๋ชจ๋ ๋์ผํ ์ฐจ์์ ๋ฒกํฐ๋ก ์นํ
-
์๋ฒ ๋ฉ ๋ชจ๋ธ
- ์๋ฒ ๋ฉ์ ์ํํ๋ ๋ชจ๋ธ
- Open AI โ ํ
์คํธ ์๋ฒ ๋ฉ 3
- ๊ตฌ๊ธ โ Gecko
2. ์๋ฒ ๋ฉ ์ ์ฌ๋
1๏ธโฃ ์ฝ์ฌ์ธ ์ ์ฌ๋
- ๋ ๋ฒกํฐ๊ฐ ๊ฐ๋ฆฌํค๋ ๋ฐฉํฅ์ด ์ผ๋ง๋ ๋น์ทํ์ง ์ธก์
- ์คํ๋ง AI๊ฐ Default๋ก ์ฌ์ฉ
- ์ฅ์
- ๋ฒกํฐ์ ํฌ๊ธฐ์ ์ํฅ์ ๋ฐ์ง ์๊ณ ๋ฐฉํฅ๋ง ์ํฅ์ ๋ฐ์
- ์งง์ ๋จ์ด์ผ์๋ก ํจ๊ณผ์ ์ธ ๋ฐ์ ๊ฐ๋ฅ
2๏ธโฃ ์ ํด๋ฆฌ๋์ ๊ฑฐ๋ฆฌ
- ๋ ๋ฒกํฐ ์ฌ์ด์ ์ง์ ๊ฑฐ๋ฆฌ ์ธก์
- ๋ ์ ์ฌ์ด์ ๊ฑฐ๋ฆฌ๋ฅผ ๊ตฌํ๋ ํผํ๊ณ ๋ผ์ค ์ ๋ฆฌ๋ฅผ ๊ณ ์ฐจ์์ผ๋ก ํ์ฅํ ๊ฒ
- ๋ฒกํฐ ํฌ๊ธฐ์ ์ํฅ์ ๋ฐ์
3. ์ธ๋ฑ์ฑ
- ๋ฒกํฐ, ์๋ณธ ํ
์คํธ ๋ฐ ๊ทธ ๋ฉํ๋ฐ์ดํฐ๋ค์ ๋ฒกํฐ ์ ์ฅ์์ ์ ์ฅํ๋ ํ์
4. ์คํ๋ง AI
- ์๋ฒ ๋ฉ๊ณผ Vector Store ๊ธฐ๋ฅ์ ์ด์ฉํด RAG ๊ตฌ์กฐ๋ฅผ ๊ตฌํ
- ๋ฌธ์ ๊ธธ์ด๊ฐ ๊ธธ๋ฉด ํ ํฐ ๊ธธ์ด ์ ํ์ ๊ฑธ๋ฆฌ๊ณ , ๋๋ฌด ์์ผ๋ฉด ์ ์ฌ๋๊ฐ ๋ฎ์ผ๋ฏ๋ก ์ ์ ํ ๊ฐ์๋ก ๊ฐ์ ธ์ค๋ ๊ฒ์ด ์ค์
- ๊ฐ์ฅ ๊ฐ๋จํ RAG โ ์ฑ๋ด