
๐ง AI์ ์ญ์ฌ๋ถํฐ Transformer ๋ฑ์ฅ ์ ๊น์ง ์ ๋ฆฌ ๐ง
1950๋ / ์ปดํจํฐ๊ฐ ์๊ฒจ๋จ๊ณผ ํจ๊ป ์ธ๊ณต์ง๋ฅ(๋จธ์ ๋ฌ๋)์ด ์๊ฒจ๋ฌ๋ค.
2000๋ / ํฐ ๋ ธ์ด๋ง์ด ์ปดํจํฐ์ ๊ธฐ๋ณธ ๊ตฌ์กฐ๋ฅผ CPU, ๋ฉ๋ชจ๋ฆฌ, ์ฐ์ฐ์ฅ์น๋ก ์ ์ํ๋ค.
๋ฉ๋ชจ๋ฆฌ๋ฅผ ์ฆ๊ฐ์ํค๋ ค๋ฉด 1๊ฐ์ CPU๋ฅผ ์ค์ฌ์ผ๋ก ํ์ฅ์ํค๋ฉฐ, ๋น์ฉ๋ ๋ง์ด ๋ค์๊ธฐ ๋๋ฌธ์ ํจ์จ์ ์ด์ง ์์๋ค.
(์ค์ฌ CPU์์ ์ฅ์ ๊ฐ ๋ฐ์ํ ๊ฒฝ์ฐ ํด๋น ์์คํ
์ down๋๋ ๊ฒ์ด๋ค.)
์ดํ ํด๋ผ์ฐ๋๊ฐ ๋ฑ์ฅํ๊ฒ ๋๋ฉด์ CPU๋ฅผ ๋ณ๋ ฌ๋ก ๋ถ์ฌ ๊ฐ์ํ๋ฅผ ์ํด์ผ๋ก์จ ์ฑ๋ฅ์ ๋์๊ณ , ์ฌ๋์ ๋ด๋ฐ์ ํ๋ด๋ผ ์ ์๊ฒ ๋์๋ค.
๋์์, ์ฌ๋๋ค์ด ์ปดํจํฐ๋ฅผ ์ฌ์ฉํจ์ผ๋ก์จ ๋ฐ์ดํฐ๊ฐ ์์ด๋๋ฐ, ์ ํ ๋ฐ์ดํฐ์ ๋น์ ํ ๋ฐ์ดํฐ๋ก ๋๋๋ค.
๋ฏธ๋ฆฌ ์ ํด๋์ ํ์๊ณผ ๊ตฌ์กฐ์ ๋ฐ๋ผ ์ ์ฅ๋ ๋ฐ์ดํฐ
์๋ฏธ์๋ ๋ฐ์ดํฐ๋ฅผ ๋ชจ๋ธ๋งํด ์ปดํจํฐ๊ฐ ์ดํดํ๋๋ก ๊ด๊ณ์ฐ์ฐ(ํ)๋ก ๊ตฌ์ฑ
ex) RDB์ ํ
์ด๋ธ, spreadsheet, csv ๋ฑ
์ฐธ๊ณ -TTA ์ ๋ณดํต์ ์ฉ์ด์ฌ์ -์ ํ ๋ฐ์ดํฐ
์ ์๋ ๊ตฌ์กฐ๊ฐ ์์ด ์ ํํ๋์ง ์์ ๋ฐ์ดํฐ
ex) ๋์์ ํ์ผ, ์ค๋์ค ํ์ผ, ์ฌ์ง ๋ฑ
์ฐธ๊ณ -TTA ์ ๋ณดํต์ ์ฉ์ด์ฌ์ -๋น์ ํ ๋ฐ์ดํฐ
ํด๋ผ์ฐ๋ ๋์
์ด์ ์๋ ์ ํ ๋ฐ์ดํฐ๋ฅผ ์ฃผ๋ก ํ์ฉํด ์ธ๊ณต์ง๋ฅ์ ํ์ต์์ผฐ๋ค.
(์ค์ ๋ก ์ ์ฒด ๋ฐ์ดํฐ์ 80%๊ฐ ์ ํ ๋ฐ์ดํฐ์ด๋ค.)
๋น์ ํ ๋ฐ์ดํฐ๋ ์ ์๋ ํ์๊ณผ ๊ตฌ์กฐ๊ฐ ์์๊ธฐ ๋๋ฌธ์ ์ด๋ฅผ ์ ์ฅํด ๋ถ์ํ๊ณ , ํ์ฉํ๋๋ฐ ์ด๋ ค์์ด ๋ง์๋ค.
ํ์ง๋ง ํด๋ผ์ฐ๋๊ฐ ๋์ ๋๋ฉด์ ์๋ ํ์ฅ, AI ๋ถ์, ์ค์๊ฐ ๋ฐ์ดํฐ ์ฒ๋ฆฌ, ๋ณด์ ๊ด๋ฆฌ ๋ฑ์ด ์ฉ์ดํด์ง๋ฉด์ ๋น์ ํ ๋ฐ์ดํฐ๋ฅผ ์ฝ๊ฒ ์ ์ฅ, ๋ถ์, ํ์ฉํ ์ ์๊ฒ ๋์๋ค.
๊ทธ๋ฌ๋ฉด์ ๋ฅ๋ฌ๋์ด ๋ฑ์ฅํ๊ฒ ๋์์ผ๋ฉฐ, ๋ํ์ ์ผ๋ก CNN, RNN/LSTM์ด ์๋ค. CNN์ด๋ ์ธ๊ฐ์ ์๊ฐ์ ๋ชจ๋ฐฉํ ์ธ๊ณต์ง๋ฅ์ผ๋ก, ์ด๋ฏธ์ง๋ท ํ๋ก์ ํธ๋ฅผ ํตํด ๋ฐ์ ํ๋ค. RNN/LSTM์ด๋ ์ฌ๋์ด ์์ฐจ์ ์ธ ๋ฐ์ดํฐ ๋ณํ์ ์ํํ๋ ๋ฐฉ์์ ๋ชจ๋ฐฉํ ์ธ๊ณต์ง๋ฅ์ผ๋ก, Text data(์ ํ ๋ฐ์ดํฐ)๋ฅผ ํตํด ๋ฐ์ ํ๋ค.
2017/ 'Attention Is All You Need' ๋ ผ๋ฌธ์์ Transformer model์ ์ ์ํ๋ค.
Transformer model์ seq2seq Model์ Encoder์ Decoder๋ก ๋๋์ด์ง ๊ตฌ์กฐ๋ฅผ ๋ฐ๋ฅด๋ฉด์ Attention๋ง์ผ๋ก ๊ตฌํํ ๋ชจ๋ธ์ด๋ค. ์ด๋ฅผ ๊ธฐ๋ฐ์ผ๋ก BERT, LLM, GPT, foundation Model ๋ฑ์ด ์๊ฒจ๋ฌ๋ค.
์ดํ ์์, ์ด๋ฏธ์ง ์ฒ๋ฆฌ๋ฅผ ์ํ Foundation Model ๋ฑ ์ฌ๋ฌ Model์ด ๊ฐ๋ฐ๋๋ค. ์ต๊ทผ DeepSeek๊ฐ ๋ฑ์ฅํ์์ผ๋, ๋ณด์ ๋ฌธ์ ๊ฐ ๋ฐ๊ฒฌ๋๋ฉด์ ์ฌ์ฉ ๊ธ์ง๋๊ณ ์๋ค.
๋ฅ๋ฌ๋ ๋ฑ์ฅ ์ด์ ์ ์ ํต์ ๊ฐ๋ฐ, AI ์ํํธ์จ์ด ๊ฐ๋ฐ์ด๋ผ๊ณ ๋ถ๋ฅผ ์ ์๋ค.
ํ์ฌ์ ์ ์ฉํ ๋ฌด์ธ๊ฐ๋ฅผ ๋ง๋ค์ด ์ปดํจํฐ/๊ธฐ๊ณ์๊ฒ ์ผ์ ์ํค๋ ๊ณผ์ ์ด๋ ๋๊ตฌ์ด๋ค. (=์ฐ์ญ) ๋ํ์ ์ผ๋ก ํ๋ก๊ทธ๋๋ฐ์ด ์์ผ๋ฉฐ, ์๊ตฌ์ฌํญ์ ํจ์๋ก ์ ์ํด ํ๋ก๊ทธ๋๋ฐ ํ๋ค.
๋ฏธ๋์ ๋ฌด์ธ๊ฐ๋ฅผ ๋ง๋ค์ด ์ปดํจํฐ/๊ธฐ๊ณ๊ฐ ์ค์ค๋ก ์ฒ๋ฆฌํ ์ ์๊ฒ ์ค๋น์ํค๋ ๊ณผ์ ์ด๋ ๋๊ตฌ์ด๋ค. (=๊ฒฝํ/๊ท๋ฉ) ์ฆ, ๋ฐ์ดํฐ๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ๋์ํ๋ Model์ ์์ฑํ๋ฉฐ, ๋ชจ๋ธ์ ํจ์์ ๊ฐ์ค์น๋ฅผ ํตํด ๋ฐ์ดํฐ๋ฅผ ํ์ตํ๋ค. ๊ฐ์ค์น์ ๋ฐ๋ผ ์์ธก, ๋ถ๋ฅ, ์ถ์ฒ ๋ชจ๋ธ๋ก ๋๋๋ค.
์ปดํจํฐ๊ฐ ์ง์ ์ฐพ์ ํจ์, ์ฆ ๋ฐ์ดํฐ๋ฅผ ํ ๋๋ก ์ธ๊ณผ๊ด๊ณ๋ฅผ ์ฐพ๋ ๊ฒ์ ์๋ฏธํ๋ค.
์ฆ, ๊ณผ๊ฑฐ์๋ ํ๋ก๊ทธ๋๋ฐ์ ํตํด ์ ๋ ฅ๊ณผ ๊ฒฐ๊ณผ ์ฌ์ด์ ๋ ผ์ง๋ฅผ ์ฌ๋์ด ํ์ ํ๊ณ ํจ์๋ฅผ ๋ง๋ค์๋ค๋ฉด, ํ์ฌ์๋ ์ ๋ ฅ๊ณผ ๊ฒฐ๊ณผ๋ฅผ ์ค๋นํด ์ปดํจํฐ๊ฐ Model๋ก ์ง์ ํจ์๋ฅผ ํ์ตํ ์ ์๋๋ก Model์ ๋ง๋ ๋ค.
๊ฐ๋ฐ๋ฟ๋ง ์๋๋ผ ์ํํธ์จ์ด ๊ฐ๋ฐ ๋ฐฉ์๋ ๋ณํํ๋ค.
์ฝ๊ฒ ์๊ฐํ๋ฉด ๊ธฐ์กด์๋ ํ๋ก๊ทธ๋๋ฐ์ ํตํด ๋ฐ์ดํฐ๋ฅผ ์ฒ๋ฆฌํด ๊ฒฐ๊ณผ๋ฅผ ์ป์๋ค๋ฉด, ๋จธ์ ๋ฌ๋์ด ๋์ ๋๋ฉด์ ์ธ๊ณต์ง๋ฅ์ ํตํด ๊ฒฐ๊ณผ๋ฅผ ์ป์ ์ ์๊ฒ ๋์๋ค.
์ฌ๊ธฐ๊น์ง๋ง ํด๋ ์ฌ๋์ด ์ง์ ํ๋ก๊ทธ๋๋ฐ์ ํจ์ผ๋ก์จ ์ธ๊ณต์ง๋ฅ์ ํ์ฉํ ๊ฒฐ๊ณผ๋ฅผ ๋์ถํ๊ณ , ๊ฒฐ๊ณผ๋ฅผ ๊ฐ๊ณตํด์ผ ํ๋ค.
ํ์ฌ์๋ ํ๋กฌํํธ๋ฅผ ํตํด ํ ์คํธ๋ก ์ํ๋ ๊ฒฐ๊ณผ๋ฅผ ์ ๋ ฅํ๋ฉด, ์ธ๊ณต์ง๋ฅ์ด ๊ฒฐ๊ณผ๋ฅผ ํ ์คํธ๋ก ๋ฐํํด ๋์ถํ๋ค. ex) ChatGPT
๋จ์ด์ ์๋ฏธ๋ฅผ ๋ฒกํฐ๋ก ๋ณํ
<UNK> ์นดํ
๊ณ ๋ฆฌ๋ก ์ฒ๋ฆฌ๋๋ค.์ด์ ๋จ์ด์ ์ธ๋ถ ๊ตฌ์ฑ๊ณผ ์ฃผ๋ณ ๋งฅ๋ฝ ํ์ ์ ์ํ Token๊ณผ Context ๊ธฐ๋ฐ ์์ฐ์ด ์ฒ๋ฆฌ ๋ฐฉ๋ฒ์ ๋์ ํ๋ค.
๊ธฐ์ต ์ฅ์น(์๋ ๊ฐ)๊ฐ ์๋ ๋ฅ๋ฌ๋ ๋คํธ์ํฌ
์ ๋ ฅ ๋ฌธ์ฅ์ ์๋๊ฐ์ ๊ณ์ฐ
Context Vector(๋ฌธ์ฅ)๋ฅผ ๋ฐ์ ๋ชฉํ ๋ฌธ์ฅ์ ์์ฑ
๊ธฐ์ต ์ฅ์น๋ฅผ ์ด์ฉํด ์ ๋ ฅ ๋ฌธ์ฅ์ ์์๋๋ก ์ฒ๋ฆฌํ๋ฉด์ ์ค๋๋ ์ ๋ณด๋ณด๋ค ์ต๊ทผ ์ ๋ณด์ ๋น์ค์ ํฌ๊ฒ ๋๊ฒ ๋๋ฉด์ ๋ฌธ์ฅ์ด ๊ธธ์ด์ง๋ฉด ๋ง๊ฐ์ด ๋ฐ์ํ๊ฒ ๋๋ค.
์ด์ Context Vector์ ์ง์ค๋๋ ๋ถ๋ด์ ๋์ด์ฃผ๊ธฐ ์ํด Attention์ ๋์ ํจ์ผ๋ก์จ ์ด๋ฅผ ํด์ํ๊ณ ์ ํ๋ค.
์ด์ด์ Attention ๋ฐ Transformer์ ๋ํด ์์๋ณด๋๋ก ํ๊ฒ ๋ค. ๐