๐ ๋์
: ์ด ๋
ผ๋ฌธ์ ์ฃผ๋ชฉํด์ผ ํ๋ ์ด์
์ค๋๋ ๋ํ ์ธ์ด๋ชจ๋ธ(LLM: Large Language Model)์ ๋๋ผ์ด ์ฑ๋ฅ์ ๋ณด์ฌ์ฃผ์ง๋ง, ๋๋ถ๋ถ์ด ํด๋ผ์ฐ๋ ์ฐ์ฐ์ ์์กดํ๊ณ ์์ต๋๋ค. ๊ทธ๋ก ์ธํด ์ง์ฐ(latency), ๋น์ฉ, ์๋์ง ์๋น, ๋ชจ๋ฐ์ผยท์ฃ์ง ๋จ๋ง์์์ ๋ฉ๋ชจ๋ฆฌ ์ ์ฝ ๋ฑ์ด ํ์ค์ ๋ฌธ์ ๋ก ๋ ์ค๋ฅด๊ณ ์์ฃ . ์ด ๋
ผ๋ฌธ์ ๋ฐ๋ก ์ด๋ฌํ ๋ฌธ์ ๋งฅ๋ฝ์์, ๋ชจ๋ฐ์ผ์ด๋ ์์ง ํ๊ฒฝ์์๋ ์ค์ฉ์ ์ผ๋ก ์ฌ์ฉํ ์ ์๋ โ10์ต ํ๋ผ๋ฏธํฐ ๋ฏธ๋ง(Sub-billion parameter)โ ์ธ์ด๋ชจ๋ธ์ ์ค๊ณ์ ์ต์ ํ๋ฅผ ๋ค๋ฃน๋๋ค.
์ฝ๊ณ ๋๋ฉด ๋
์๋ค์ ๋ค์์ ์ป๊ฒ ๋ฉ๋๋ค:
- ์ ๋จ์ํ ํ๋ผ๋ฏธํฐ ์๋ ๋ฐ์ดํฐ๋๋ง ๋๋ฆฌ๋ ๋ฐฉ์์ด ํญ์ ์ ๋ต์ด ์๋์ง
- ๋ชจ๋ฐ์ผ/์ฃ์ง ํ๊ฒฝ์ ์ ํฉํ ๋ชจ๋ธ ์ค๊ณ ๊ด์ ์์ ์ค์ํ ์ํคํ
์ฒ ์์๋ค์ด ๋ฌด์์ธ์ง
- ์ค์ ์ฑ๋ฅ ํฅ์ ๋ฐ ์จ๋๋ฐ์ด์ค ์ ์ฉ ๊ฐ๋ฅ์ฑ์ด ์ด๋ค ์์ค์ธ์ง
โฑ๏ธ Executive Summary
์ด ๋
ผ๋ฌธ์ โ๋ชจ๋ฐ์ผยท์ฃ์ง ํ๊ฒฝ์ ์ ํฉํ๊ฒ 10์ต ๋ฏธ๋ง ํ๋ผ๋ฏธํฐ์ ์ธ์ด๋ชจ๋ธ์ ์ค๊ณํ ์ ์์๊น?โ๋ผ๋ ์ง๋ฌธ์ ๋์ง๋๋ค. ํด๋ฒ์ผ๋ก ๊น๊ณ ์์(deep & thin) ์ํคํ
์ฒ, ์
ยท์ถ๋ ฅ ์๋ฒ ๋ฉ ๊ณต์ (embedding sharing), ๊ทธ๋ฃน ์ฟผ๋ฆฌ ์ดํ
์
(grouped-query attention) ๋ฑ์ ๋์
ํ์ฌ, ๊ธฐ์กด 125 M/350 M๊ธ ๋ชจ๋ธ ๋๋น ๊ฐ๊ฐ ์ฝ 2.7%/4.3% ์ ํ๋ ํฅ์์ ๋ฌ์ฑํ์ต๋๋ค. ๋ ๋์๊ฐ ๋ธ๋ก ๋จ์ ๊ฐ์ค์น ๊ณต์ (immediate block-wise weight sharing)๋ฅผ ์ถ๊ฐํ ๋ฒ์ (MobileLLM-LS)์ ๋์ผ ํฌ๊ธฐ์์ ์ถ๊ฐ 0.7%/0.8% ํฅ์์ ๋ณด์์ต๋๋ค. ์ด๋ โ์์ ๋ชจ๋ธ๋ ์ ๋๋ก ์ค๊ณํ๋ฉด ๊ฝค ๊ฐํ๋คโ๋ ์ค์ํ ๋ฉ์์ง๋ฅผ ๋์ ธ์ค๋๋ค.
๐ฌ [๋
ผ๋ฌธ ์ฌ์ธต ๋ถ์] ๋ชฉ์ฐจ๋ณ ํต์ฌ ์์ฝ
1. ์๋ก (Introduction): ๋ฌด์์ด ๋ฌธ์ ์ธ๊ฐ?
- ์ ์๋ค์ ๋ชจ๋ฐ์ผยท์ฃ์ง ๊ธฐ๊ธฐ์์์ LLM ์ ์ฉ์ด ๋ฉ๋ชจ๋ฆฌ ์ ์ฝ(์: DRAM ์ฉ๋), ์ง์ฐ/์๋ต ์๋, ํด๋ผ์ฐ๋ ์์กด์ ๋ฐ๋ฅธ ๋น์ฉ ๋ฐ ์๋์ง ์๋น ์ฆ๊ฐ ๋ฑ์ ํ์ค์ ์ ์ฝ์ ์ง๋ฉดํด ์๋ค๊ณ ์ง์ ํฉ๋๋ค.
- ํนํ, ๋ํ ๋ชจ๋ธ๋ค์ ๊ทธ๋๋ก ๋ชจ๋ฐ์ผ์ ์ฌ๋ฆฌ๋ ๊ฒ์ ํ์ค์ ์ด์ง ์์ผ๋ฉฐ, ๋ฐ๋ผ์ 10์ต ๋ฏธ๋ง ํ๋ผ๋ฏธํฐ(์ฆ sub-billion scale) ๋ชจ๋ธ์ด ํ์ค์ ๋์์ด ๋ ์ ์๋ค๋ ์ธ์์ ์ ์ํฉ๋๋ค.
- ๊ธฐ์กด ์ฐ๊ตฌ์์๋ ์ฃผ๋ก โ๋ ๋ง์ ํ๋ผ๋ฏธํฐ + ๋ ๋ง์ ๋ฐ์ดํฐโ๊ฐ ์ฑ๋ฅ์ ๊ฒฐ์ ์ง๋ ํต์ฌ์ด๋ผ๊ณ ์ฌ๊ฒจ์ก์ง๋ง, ๋ณธ ๋
ผ๋ฌธ์ โ์ด ๊ท๋ชจ ์ดํ์์๋ ๋ชจ๋ธ ์ํคํ
์ฒ๊ฐ ํจ์ฌ ๋ ์ค์ํ๋คโ๋ ์ฐ๊ตฌ ๊ฐญ(Research Gap)์ ์ ์ํฉ๋๋ค.
- ๋ฐ๋ผ์ ๋ณธ ์ฐ๊ตฌ์ ๋ชฉ์ ์ ๋ค์๊ณผ ๊ฐ์ต๋๋ค: ๋ชจ๋ฐ์ผ ์ฌ์ฉ ํ๊ฒฝ์ ์ ํฉํ๊ฒ ์๊ณ ํจ์จ์ ์ธ ์ธ์ด๋ชจ๋ธ์ ์ค๊ณํ๊ณ , ์ด๋ฅผ ํตํด ๊ธฐ์กด ๋์ผ ๊ท๋ชจ ๋ชจ๋ธ ๋๋น ์ฑ๋ฅ์ ํฅ์์ํจ๋ค๋ ๊ฒ.
2. ์ด๋ก ์ ๋ฐฐ๊ฒฝ / ์ ํ ์ฐ๊ตฌ (Literature Review):
-
๋
ผ๋ฌธ์ ๋จผ์ ๊ธฐ์กด ๋ํ์ธ์ด๋ชจ๋ธ์ ์ค์ผ์ผ๋ง ๋ฒ์น(scaling laws) โ ํ๋ผ๋ฏธํฐ ์, ํ์ต ๋ฐ์ดํฐ ์, ์ฐ์ฐ๋ ๋ฑ์ด ๋ชจ๋ธ ์ฑ๋ฅ์ ๊ฒฐ์ ํ๋ค๋ โ ์ ์์ฝํฉ๋๋ค.
-
ํ์ง๋ง ์ํ๋ชจ๋ธ(sub-billion scale)์์๋ ์ด๋ฌํ ๋ฒ์น์ด ๊ทธ๋๋ก ์ ์ฉ๋์ง ์์ ์ ์์ผ๋ฉฐ, ์ค์ ๋ก ์ํคํ
์ฒ ์ค๊ณ ๋ณํ๊ฐ ์ฑ๋ฅ์ ์ ์๋ฏธํ ์ํฅ์ ๋ฏธ์น ์ ์๋ค๋ ์ ํ ์ฐ๊ตฌ๋ค์ ์ธ๊ธํฉ๋๋ค.
-
๋ํ, ์๋ฒ ๋ฉ ๊ณต์ (embedding sharing), ๋ ์ด์ด ๊ณต์ (layer sharing), ์ดํ
์
๊ตฌ์กฐ ์ต์ ํ(attention mechanism) ๋ฑ์ ๊ฒฝ๋ํ ๋ฐ ํจ์จํ ๊ธฐ๋ฒ๋ค์ด ๊ทธ๊ฐ ์ ์๋์ด ์์ต๋๋ค.
-
๋ณธ ๋
ผ๋ฌธ์ด ๊ฐ์ง ์ฐจ๋ณ์ ์:
- ๋จ์ํ ํ๋ฃจ๋(pruning), ์์ํ(quantization) ๋๋ ์ง์์ฆ๋ฅ(distillation)๋ฅผ ๋์ด ์ํคํ
์ฒ ์ค๊ณ(๊น๊ณ ์์ ๊ตฌ์กฐ, grouped-query attention ๋ฑ) ์์ฒด๋ฅผ ์ค์ฌ์ ๋์๋ค๋ ์
- ๋ชจ๋ฐ์ผ/์ฃ์ง ํ๊ฒฝ์์์ ์ค์ ์ฌ์ฉ ๊ฐ๋ฅ์ฑ๊น์ง ๊ณ ๋ คํ๋ค๋ ์
- ๋์ผํ ํ๋ผ๋ฏธํฐ ๋ฒ์ ๋ด์์ ๊ธฐ์กด ๋๋น ์ฑ๋ฅ ํฅ์์ ๋ช
์์ ์ผ๋ก ๋ณด์ฌ์ฃผ์๋ค๋ ์
3. ์ฐ๊ตฌ ๋ฐฉ๋ฒ๋ก (Methodology): ์ด๋ป๊ฒ ์ฆ๋ช
ํ๋๊ฐ?
-
์ฐ๊ตฌ ์ง๋ฌธ(Research Question)์ ํฌ๊ฒ โ์์ ๊ท๋ชจ ์ธ์ด๋ชจ๋ธ์์๋ ์ํคํ
์ฒ ๊ฐ์ ์ผ๋ก ์ฑ๋ฅ์ ์๋ฏธ์๊ฒ ํฅ์์ํฌ ์ ์๋๊ฐ?โ ๊ทธ๋ฆฌ๊ณ โ๊ทธ ํฅ์๋ ๋ชจ๋ธ์ด ๋ชจ๋ฐ์ผยท์ฃ์ง ํ๊ฒฝ์ ์ค์ ๋ก ๋ฐฐํฌ ๊ฐ๋ฅํ ์์ค์ธ๊ฐ?โ ๋ฑ์ผ๋ก ์์ฝ๋ฉ๋๋ค.
-
๋ฐ์ดํฐ ๋ฐ ์คํ ์ค์ : ๋
ผ๋ฌธ์์๋ ๋ค์ํ ๊ท๋ชจ (์: 125M, 350M ๋ฑ)์ ๋ชจ๋ธ์ ๋์์ผ๋ก ์ ์๋ ์ค๊ณ ์์๋ค์ ํจ๊ณผ๋ฅผ ์ ๋ก์ท(zero-shot) ์์์ถ๋ก , ์ง๋ฌธ์๋ต(task) ๋ฑ ์ฌ๋ฌ ๋ฒค์น๋งํฌ์์ ํ๊ฐํ์ต๋๋ค.
-
ํต์ฌ ์ค๊ณ์์:
- SwiGLU ํ์ฑํ ํจ์: ๊ธฐ์กด ReLU ๊ธฐ๋ฐ FFN(feed-forward network) ๋์ SwiGLU๋ฅผ ์ฑํํ์ฌ ๋น์ ํ์ฑ์ ๊ฐํํ์ต๋๋ค.
- ๊น๊ณ ์์(Deep & Thin) ์ํคํ
์ฒ: ๋์ผํ ํ๋ผ๋ฏธํฐ ์๋ผ๋ฉด ๋ ์ด์ด ์(Layers)๋ฅผ ๋์ด๊ณ ๊ฐ ๋ ์ด์ด ํญ(width)์ ์ค์ด๋ ๊ตฌ์กฐ๊ฐ ์ฑ๋ฅ์ ์ ๋ฆฌํ๋ค๋ ์คํ์ ์ฆ๊ฑฐ๋ฅผ ์ ์ํ์ต๋๋ค.
- ์๋ฒ ๋ฉ ๊ณต์ (Embedding Sharing): ์ํ ๋ชจ๋ธ์์๋ ์๋ฒ ๋ฉ ์ธต์ด ์ ์ฒด ํ๋ผ๋ฏธํฐ์์ ์ฐจ์งํ๋ ๋น์ค์ด ์ปค์ง๋ฏ๋ก, ์
๋ ฅ(Input) ๋ฐ ์ถ๋ ฅ(Output) ์๋ฒ ๋ฉ์ ๊ณต์ ํจ์ผ๋ก์จ ํ๋ผ๋ฏธํฐ ์ ๊ฐ๊ณผ ํจ์จํ๋ฅผ ์ด๋ฃจ์์ต๋๋ค.
- ๊ทธ๋ฃน ์ฟผ๋ฆฌ ์ดํ
์
(Grouped-Query Attention, GQA): ์ฟผ๋ฆฌ ํค๋(Query head)๋ฅผ ๊ทธ๋ฃนํํ๊ณ ํค/๊ฐ ํค๋(Key/Value) ์๋ฅผ ์ค์ฌ ์ดํ
์
์ฐ์ฐ์ ํจ์จํํ๋ฉด์๋ ์ฑ๋ฅ์ ์ ์งํ๋ ๊ตฌ์กฐ๋ฅผ ๋์
ํ์ต๋๋ค.
- ๋ธ๋ก ๋จ์ ๊ฐ์ค์น ๊ณต์ (Block-wise Weight Sharing): ๋ชจ๋ธ์ ํฌ๊ธฐ๋ฅผ ๋๋ฆฌ์ง ์์ผ๋ฉด์๋ ๋ ์ด์ด ๊ฐ ๊ฐ์ค์น๋ฅผ ๊ณต์ ํด ์ถ๊ฐ ์ฑ๋ฅ ํฅ์์ ๊พํ ๋ฐฉ์์
๋๋ค.
-
์คํ ์ค๊ณ์์๋ ์ ์์๋ค์ ์กฐํฉํ ๋ชจ๋ธ๊ตฐ(์: MobileLLM-125M, MobileLLM-350M, ๊ทธ๋ฆฌ๊ณ ๋ ์ด์ด ๊ณต์ ๋ฒ์ ์ธ MobileLLM-LS)๊ณผ ๊ธฐ์กด ๋์ข
๊ท๋ชจ ๋ชจ๋ธ์ ๋น๊ตํ์์ต๋๋ค.
4. ์ฐ๊ตฌ ๊ฒฐ๊ณผ (Results): ๋ฌด์์ ๋ฐ๊ฒฌํ๋๊ฐ?
-
ํต์ฌ ์คํ ๊ฒฐ๊ณผ๋ ๋ค์๊ณผ ๊ฐ์ต๋๋ค:
- MobileLLM-125M/350M ๋ชจ๋ธ์ด ๊ธฐ์กด ๋์ข
๊ท๋ชจ ๋ชจ๋ธ ๋๋น ๊ฐ๊ฐ ์ฝ 2.7% / 4.3% ์ ํ๋ ํฅ์์ ๋ณด์์ต๋๋ค.
- ๋ธ๋ก ๋จ์ ๊ฐ์ค์น ๊ณต์ ๋ฅผ ์ ์ฉํ MobileLLM-LS ๋ฒ์ ์ ๋์ผ ํฌ๊ธฐ์์ ์ถ๊ฐ๋ก ์ฝ 0.7% / 0.8% ํฅ์๋ ์ฑ๋ฅ์ ๋ณด์ฌ์ฃผ์์ต๋๋ค.
- ์ฑํ
(chat) ๋ฒค์น๋งํฌ์์๋ ์ํ ๋ชจ๋ธ์์๋ ์ฐ์ํ ์ฑ๋ฅ์ ๋ณด์์ผ๋ฉฐ, ์ด๋ค API ํธ์ถ(tasks)์์๋ LLaMAโv2-7B๊ธ ๋ชจ๋ธ๊ณผ ๊ทผ์ ํ ์ ๋ฐ๋๋ฅผ ๊ธฐ๋กํ๋ค๋ ๋ณด๊ณ ๊ฐ ์์ต๋๋ค.
-
๋ํ ๋ฐฐํฌ ๊ด์ ์์ ์ค์ ๋ชจ๋ฐ์ผ ํ๊ฒฝ ์ ์ฉ ๊ฐ๋ฅ์ฑ์ ๊ณ ๋ คํ ๊ฒฐ๊ณผ๋ ์ ์๋์ด ์์ต๋๋ค. ์์ปจ๋, ๋ฉ๋ชจ๋ฆฌยท์ง์ฐยท์๋์ง ์ธก๋ฉด์์ ์ํ ๋ชจ๋ธ์ด ์ ๋ฆฌํ๋ค๋ ์ธ๊ธ์ด ์์ต๋๋ค.
-
์ข
ํฉํ๋ฉด, ์ด ๋
ผ๋ฌธ์ โ๊ฐ์ ํ๋ผ๋ฏธํฐ ์์ฐ์ด๋ผ๋ฉด ์ํคํ
์ฒ ์ค๊ณ๊ฐ ์ฑ๋ฅ์ ๊ฒฐ์ ์ง๋ ์ค์ํ ์ถ์ด ๋ ์ ์๋คโ๋ ์ค์ฆ์ ๊ทผ๊ฑฐ๋ฅผ ์ ๊ณตํฉ๋๋ค.
5. ๊ฒฐ๋ก ๋ฐ ์ ์ธ (Conclusion & Discussion): ์ด ์ฐ๊ตฌ๊ฐ ์ ์ค์ํ๊ฐ?
-
์ด ์ฐ๊ตฌ๋ ํ์ ์ ์์๋ก ๋ณด๋ฉด, ์ํ ์ธ์ด๋ชจ๋ธ ์ค๊ณ์ ์์ด ํ๋ผ๋ฏธํฐ ์ยท๋ฐ์ดํฐ๋ ์ค์ฌ์ ๊ด์ ์์ ๋ฒ์ด๋ ์ํคํ
์ฒ ์ค์ฌ์ ์ค๊ณ ์ ๋ต์ ์ ์ํ๋ค๋ ์ ์ด ์ค์ํฉ๋๋ค.
-
์ค๋ฌด์ ์๋ฏธ๋ก ๋ณด๋ฉด, ๋ชจ๋ฐ์ผยท์ฃ์ง ๊ธฐ๊ธฐ์์ ์ง์ ์ธ์ด๋ชจ๋ธ์ ๊ตฌ๋ํ๋ ค๋ ๊ฐ๋ฐ์๋ ์ ํ ๊ด์ ์์ ๋งค์ฐ ์ ์๋ฏธํ ์ค๊ณ ๊ฐ์ด๋๋ฅผ ์ ๊ณตํ๋ค๋ ์ ์
๋๋ค. ์ฆ, โ๋ฌด์กฐ๊ฑด ํฌ๊ณ ๋น์ผ ๋ชจ๋ธ์ ์ฐ์โ๋ ์ ๊ทผ์ด ์๋๋ผ โํ๊ฒฝ ์ ์ฝ์ ๊ณ ๋ คํ ์ค๊ณโ์ ๊ฐ๋ฅ์ฑ์ ์ด์ด์ฃผ์๋ค๊ณ ๋ณผ ์ ์์ต๋๋ค.
-
๋
ผ๋ฌธ์์ ์ ์๋ค์ด ๋ฐํ ํ๊ณ์ ๋ฐ ํฅํ ์ฐ๊ตฌ ์ ์ธ์ ๋ค์๊ณผ ๊ฐ์ต๋๋ค:
- ๋ณธ ์ฐ๊ตฌ๋ ์ฃผ๋ก ์ ๋ก์ท ์์์ถ๋ก ๋ฐ ์ฑํ
๋ฒค์น๋งํฌ์ ์ง์ค๋์ด ์์ผ๋ฉฐ, ๋ ๋ณต์กํ๊ฑฐ๋ ๋๋ฉ์ธ ํนํ๋ ์์
์ ๋ํ ๊ฒ์ฆ์ ์ ํ์ ์
๋๋ค.
- ๋ํ, ์จ๋๋ฐ์ด์ค ์ค์ ์ ํํ ๊ณผ์ ์์์ ๋ฐฐํฌยท์ต์ ํยท์ ๋ ฅ์๋ชจยท์ค์๊ฐ ์๋ต์ฑ ๋ฑ ์๋ํฌ์๋(end-to-end) ๊ตฌํ ๊ณผ์ ๋ ์์ง ๋จ์ ์๋ค๊ณ ํฉ๋๋ค.
- ํฅํ ์ฐ๊ตฌ๋ก๋ ๋ ๋ฎ์ ๋นํธ ์์ํ(low-bit quantization), ๊ธด ์ปจํ
์คํธ(long-context) ์ง์, ๋ค์ํ ๊ธฐ๊ธฐ ํ๊ฒฝ์์์ ์คํ, ๊ทธ๋ฆฌ๊ณ ๋ ์์ ๋ชจ๋ธ์ ์ถ๊ฐ์ ๊ฒฝ๋ํ ๋ฑ์ด ์ ์๋์ด ์์ต๋๋ค.
๐ง ํต์ฌ ์ธ์ฌ์ดํธ ๋ฐ ์์ฌ์
-
์ธ์ฌ์ดํธ: ์ด ๋
ผ๋ฌธ์์ ๊ฐ์ฅ ์ฃผ๋ชฉํ ๋งํ ๊ด์ ์ โ์์ ๋ชจ๋ธ์์๋ ์ํคํ
์ฒ์ ์ค๊ณ๊ฐ ๋งค์ฐ ์ค์ํ๋คโ๋ ์ ์
๋๋ค. ํนํ ๋ชจ๋ฐ์ผยท์ฃ์ง ํ๊ฒฝ์ฒ๋ผ ์์์ด ์ ํ๋ ์ํฉ์์๋ ํ๋ผ๋ฏธํฐ ์๋ฅผ ๋ฌด์์ ๋๋ฆฌ๋ ๊ฒ๋ณด๋ค ๋ชจ๋ธ์ ๊น์ด/ํญ ์กฐ์ , ์๋ฒ ๋ฉ ๊ณต์ , ์ดํ
์
๊ตฌ์กฐ ์ต์ ํ ๋ฑ์ด ๋ ํฐ ํจ๊ณผ๋ฅผ ๋ผ ์ ์๋ค๋ ์ฌ์ค์ด ์ค๊ณ์๋ค์๊ฒ ์ค์ํ ์์ฌ์ ์ ์ค๋๋ค.
-
์ค๋ฌด ์ ์ฉ: ์ ํํ ๊ด์ ์์ ์ด ๋
ผ๋ฌธ์ ๋ฐฉ๋ฒ๋ก ์ ์ ์ฉํด ๋ณด๋ฉด ์๋์ ๊ฐ์ ๋ฐฉ์์ด ๊ฐ๋ฅํฉ๋๋ค:
- ๋ชจ๋ฐ์ผ ์ฑ ๋ด ์ธ์ด๋ชจ๋ธ ํ์ฌ ์, 1 ์ต~3 ์ต ํ๋ผ๋ฏธํฐ ์์ค์์ ๊น๊ณ ์์ ๋ ์ด์ด ๊ตฌ์กฐ๋ฅผ ์ค๊ณํด ๋ณด์ธ์.
- ์๋ฒ ๋ฉ ๊ณ์ธต์ด ์ฐจ์งํ๋ ๋ฉ๋ชจ๋ฆฌ ๋น์ค์ด ํฐ ๊ฒฝ์ฐ, ์
์ถ๋ ฅ ์๋ฒ ๋ฉ ๊ณต์ ๋ฅผ ํตํด ํ๋ผ๋ฏธํฐ ์ ๊ฐ๊ณผ ๋ฉ๋ชจ๋ฆฌ ํจ์จ์ ํจ๊ป ๋๋ชจํ ์ ์์ต๋๋ค.
- ์ดํ
์
๊ตฌ์กฐ์์ ํค/๊ฐ ํค๋ ์๋ฅผ ์ค์ด๊ณ ์ฟผ๋ฆฌ ํค๋๋ฅผ ๊ทธ๋ฃนํํ๋ ๋ฐฉ์(GQA)์ ํตํด ์ ์ง์ฐยท์ ์์ ํ๊ฒฝ์์์ ํจ์จ์ ๊ฐ์ ํ ์ ์์ต๋๋ค.
- ๊ฐ์ค์น ๊ณต์ ๊ธฐ๋ฒ์ ๋์
ํ๋ฉด ๋ชจ๋ธ ํฌ๊ธฐ๋ฅผ ํฌ๊ฒ ํค์ฐ์ง ์๊ณ ๋ ์ฑ๋ฅ ํฅ์์ ๊พํ ์ ์์ผ๋ฏ๋ก, ์ค์ ๋ฐฐํฌ ์ ์คํ ๋จ๊ณ์์ ๊ณ ๋ คํ ๋งํฉ๋๋ค.
- ์ด๋ฌํ ์ค๊ณ ์ ๋ต์ ํนํ ์ธํฐ๋ท ์ฐ๊ฒฐ์ด ๋ถ์์ ํ๊ฑฐ๋ ์ง์ฐ์ด ์ค์ํ ๋ชจ๋ฐ์ผ/์ฃ์ง ์ ํ๋ฆฌ์ผ์ด์
(์: ์คํ๋ผ์ธ ์ฑ๋ด, ์ค์๊ฐ ์์ฑ/ํ
์คํธ ์ธํฐํ์ด์ค ๋ฑ)์์ ๊ฒฝ์๋ ฅ์ ๊ฐ์ง ์ ์์ต๋๋ค.
โ ๏ธ [๋นํ์ ๊ฒํ ] ๋
ผ๋ฌธ์ ํ๊ณ์ ์๊ฐํด ๋ณผ ์
๐ ๋ง๋ฌด๋ฆฌํ๋ฉฐ
ํ ๋ฌธ์ฅ์ผ๋ก ์ ๋ฆฌํ์๋ฉด:
โ๋ชจ๋ฐ์ผยท์ฃ์ง ํ๊ฒฝ์์๋ ์ค๊ณ๋ง ์ํ๋ฉด โ10์ต ๋ฏธ๋งโ ์ธ์ด๋ชจ๋ธ๋ก ๊ฝค ๊ฐ๋ ฅํ ์ฑ๋ฅ์ ๋ผ ์ ์๋ค.โ