๐ ๋ฅ๋ฌ๋์ด๋?
- ์ธ๊ฐ์ ๋ด๋ฐ์ ๋ชจ๋ฐฉํ์ฌ ๋ง๋ ๊ฒ โ ํผ์
ํธ๋ก (Perceptron)
- ํผ์
ํธ๋ก ์ AND, OR ์ฐ์ฐ ๊ฐ๋ฅํ์ง๋ง, XOR ์ฐ์ฐ ๋ถ๊ฐ๋ฅ โ 1์ฐจ ์๊ธฐ ๋ฐ์
- ์ด๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด ๋ค์ธต ํผ์
ํธ๋ก (MLP, Multi-Layer Perceptron)์ด ๋ฑ์ฅ โ ANN(Artificial Neural Network) ํ์
- ANN์ ํ์ฅํ์ด DNN(Deep Neural Network)
- DNN = ์๋์ธต(Hidden Layer)์ด ๋ง์ ๋ณต์กํ ์ฐ์ฐ ๊ฐ๋ฅ
๐ ํน์ํ ๋ฅ๋ฌ๋ ๋ชจ๋ธ๋ค
- ๐ ์์ฐ์ด ์ฒ๋ฆฌ (LLM, NLP)
๐น ํ ํฐ(Token) & ํ ํฐํ(Tokenization)
- ๋ฌธ์ฅ์ ์์ ๋จ์(ํ ํฐ)๋ก ๋๋๋ ๊ณผ์
์: "๋๋ ์ฌ๊ณผ๋ฅผ ์ข์ํด" โ ["๋๋", "์ฌ๊ณผ๋ฅผ", "์ข์ํด"]
- ํ ํฐ์ ์ซ์๋ก ๋ณํํ๋ ๊ณผ์ โ ์ธ๋ฑ์ฑ(Indexing)
0: ๋๋
1: ์ฌ๊ณผ๋ฅผ
2: ์ข์ํด
๐น ์๋ ์๋ฒ ๋ฉ (Word Embedding)
- ๋จ์ด๋ฅผ ์ซ์๋ก ๋ณํํ๋๋ฐ, ๋จ์ํ ์ธ๋ฑ์ค๊ฐ ์๋๋ผ ์๋ฏธ๋ฅผ ๋ฐ์ํ ๋ฒกํฐ ํํ
- ๋น์ทํ ์๋ฏธ์ ๋จ์ด๋ค์ด ๊ฐ๊น์ด ๋ฒกํฐ๋ก ๋ฐฐ์น๋จ
์์ : Word2Vec, GloVe, FastText