ํฐ ๋ฐ์ดํฐ ์
์์ ์ฐ์์ ์ธ ๋จ์ด์ ๋ฒกํฐ๋ฅผ ํํ์ ๊ณ์ฐํ๋ 2๊ฐ์ ๋ชจ๋ธ ๊ตฌ์กฐ๋ฅผ ์ ์ํ๋ คํจ.
์ด์ ์ ๊ฐ์ฅ ์ฑ๋ฅ์ด ์ข๋ ๋ชจ๋ธ๋ณด๋ค ์ ํ๋ ์ฆ๊ฐ, ๊ณ์ฐ ๋น์ฉ์ด ์ค์ด๋ฆ์ด ์๋ค. (16์ต๊ฐ์ ๋์ quality์ ๋จ์ด ๋ฒกํฐ๋ฅผ ํ๋ฃจ๋ ์๊ฑธ๋ ค์ ํ์ต ๊ฐ๋ฅ)
์ด ๋ฒกํฐ๋ค์ด syntactic, semantic ๋ฒกํฐ ์ ์ฌ๋๋ฅผ ์ธก์ ํ๋ test set์ ์ต์ ๊ธฐ์ ์ฑ๋ฅ์ ์ ๊ณตํจ
์ง๊ธ๊น์ง NLP ์์คํ
์ ๋จ์ด๋ฅผ ์์๋ก ์ฌ๊น ( ๋จ์ด ์ฌ์ด์ ์ ์ฌ์ฑ ๊ฐ๋
์ด ์์์. ๋จ์ด๋ฅผ ์ดํ์ง์์ index๋ก ์ฌ๊น )
์ด๊ฒ์ ๋ํ ์ฅ์ ๋ ์๋ค.
1. ๊ฐ๊ฒฐ์ฑ
2. ๊ฒฌ๊ณ ์ฑ
3. ํฐ ๋ฐ์ดํฐ๋ก ํ์ต๋ ๊ฐ๋จํ ๋ชจ๋ธ์ด ์ ์ ๋ฐ์ดํฐ๋ฅผ ์ด์ฉํ ๋ณต์กํ ์์คํ
๋ณด๋ค ์ข์ ๊ฒฐ๊ณผ๋ฅผ ๋
๊ทธ๋ฌ๋ ์ด ๊ฐ๋จํ ๊ธฐ์ ์ ํ๊ณ์ ์ด ์์
ex) ์๋ ์์ฑ ์ธ์์ ์ํ ๊ด๋ จ ๋๋ฉ์ธ ๋ด ๋ฐ์ดํฐ์ ์์ด ์ ํ์
๊ทธ๋์ ๋จ์ํ basic ๊ธฐ์ ์ ๊ท๋ชจํ์ฅ(๋จ์ด์ ์ฆ๊ฐ)์ผ๋ก๋ ์ค์ํ ๋ฐ์ ์ ์ด๋์ด๋ผ ์ ์๋ ์ํฉ๋ค์ด ์๊ณ , ๊ทธ๋์ ๋ ์ง๋ณด๋ ๊ธฐ์ ์ ์ด์ ์ ๋ง์ถฐ์ผ ํจ
์ต๊ทผ ๋จธ์ ๋ฌ๋ ๊ธฐ์ ์ ์ง๋ณด๋ก, ๋ ํฐ ๋ฐ์ดํฐ ์
์ ๋ณต์กํ ๋ชจ๋ธ์ ํ์ตํ๋ ๊ฒ์ด ๊ฐ๋ฅํด์ก๋ค. ๊ฐ์ฅ ์ฑ๊ณต์ ์ธ concept์ Distributed Representations of word(๋จ์ด์ ๋ถ์ฐ์ ํํ)๋ฅผ ์ด์ฉํ๋ ๊ฒ์ผ ๊ฒ์ด๋ค. ex) ๋จ์ด ๋ชจ๋ธ ๊ธฐ๋ฐ ๋ด๋ด ๋คํธ์ํฌ๊ฐ N-gram model๋ณด๋ค ์ข์ ๊ฒฐ๊ณผ๋ฅผ ๋๋ค.
(N-gram model : ๋จ์ด์ ์์ (n-1)๊ฐ์ ๋จ์ด๋ฅผ ์ฐธ๊ณ ํ์ฌ ๋จ์ด๋ฅผ ์ ์ถํ๋ ๋ฐฉ๋ฒ)
๋ ผ๋ฌธ ๋ชฉํ๋ ์์ญ์ต๊ฐ์ ๋จ์ด์ ํฐ ๋ฐ์ดํฐ์ ์์ ๋์ ํ๋ฆฌํฐ์ ๋จ์ด ๋ฒกํฐ๋ฅผ ํ์ตํ๋ ๊ธฐ์ ์ ์๊ฐํ๋ ๊ฒ์ด๋ค. ์ ์ ๋ชจ๋ธ์ ๋ง์ ๋จ์ด์ 50-100 ๋จ์ด ๋ฒกํฐ ์ฐจ์์ ์ฑ๊ณต์ ์ผ๋ก ํ์ตํ๊ฒ ์์๋ค
์ฐ๋ฆฌ๋ ์ ์ฌํ ๋จ์ด๊ฐ ์๋ก ๊ฐ๊น์ด ๊ฒฝํฅ์ด ์์ ๋ฟ๋ง ์๋๋ผ ๋จ์ด๊ฐ ์ฌ๋ฌ ์์ค์ ์ ์ฌ์ฑ์ ๊ฐ์ง ์ ์๋ค๋ ๊ธฐ๋๋ฅผ ๊ฐ์ง๊ณ ๊ฒฐ๊ณผ ๋ฒกํฐ ํํ์ ํ์ง์ ์ธก์ ํ๊ธฐ ์ํด ์ต๊ทผ ์ ์๋ ๊ธฐ์ ์ ์ฌ์ฉํ๋ค (Linguistic Regularities in Continuous Space Word Representations, 2013 : ์ฌ๋ฌ ์์ค์ ์ ์ฌ์ฑ)
์ด๊ฒ์ ์ด๋ฏธ ๋ณํ ์ธ์ด์ ๋งฅ๋ฝ์์ ์ด๊ธฐ์ ๊ด์ฐฐ๋์๋ค - ์๋ฅผ ๋ค์ด, ๋ช
์ฌ๋ ๋ณต์์ ๋จ์ด ๋์ ๊ฐ์ง ์ ์๊ณ , ๋ง์ฝ ์ฐ๋ฆฌ๊ฐ ์๋ ๋ฒกํฐ ๊ณต๊ฐ์ ๋ถ๋ถ ๊ณต๊ฐ์์ ์ ์ฌํ ๋จ์ด๋ฅผ ๊ฒ์ํ๋ค๋ฉด, ์ ์ฌํ ๋์ ๊ฐ์ง ๋จ์ด๋ฅผ ์ฐพ๋ ๊ฒ์ด ๊ฐ๋ฅํ๋ค
๋จ์ด ํํ์ ์ ์ฌ์ฑ์ ๋จ์ํ ๊ตฌ๋ฌธ(syntactic) ๊ท์น์ฑ์ ๋์ด์ ๋ค๋ ๊ฒ์ด ๋ฐ๊ฒฌ๋์๋ค.
๋จ์ด ํํ์ ์ ์ฌ์ฑ์ ๋จ์ํ ๋ฌธ๋ฒ ๊ท์น์ ๋์ด์๋๋ฐ, ๋จ์ด ๋ฒกํฐ์ ๋ํ ๋จ์ํ ๋์ ์ฐ์ฐ์ ์ํํ๋ ๋จ์ด ์คํ์ ๊ธฐ์ ์ ์ฌ์ฉํ์ฌ "King" ๋ฒกํฐ์์ "Man" ๋ฒกํฐ๋ฅผ ๋บ ํ "Woman" ๋ฒกํฐ๋ฅผ ๋ํ ๊ฒฐ๊ณผ๊ฐ "Queen" ๋ฒกํฐ ํํ์ ๊ฐ์ฅ ๊ฐ๊น์ด ๋ฒกํฐ์์ ๋ณด์ฌ์ฃผ์๋ค.
์ด ๋ ผ๋ฌธ์์๋ ๋จ์ด์ ์ ํ์ ์ธ ๊ท์น์ฑ์ ๋ณด์กดํ๋ ์๋ก์ด ๋ชจ๋ธ ๋ฐ์ ์ ํตํด ๋ฒกํฐ ์ฐ์ฐ์ ์ ํ๋๋ฅผ ๊ทน๋ํ ์ํค๋ ค ๋ ธ๋ ฅํ ๊ฒ์ด๋ค. ๊ตฌ๋ฌธ ๋ฐ ์๋ฏธ์ ๊ท์น์ฑ์ ๋ชจ๋ ์ธก์ ํ๋ ํฌ๊ด์ ์ธ ์๋ก์ด ํ ์คํธ ์ธํธ๋ฅผ ๋์์ธํ๊ณ , ์ด๋ฌํ ๊ท์น์ฑ ์ค ๋ง์ ๊ฒ๋ค์ด ๋์ ์ ํ๋๋ก ํ์ต๋ ์ ์๋ค๋ ๊ฒ์ ๋ณด์ฌ์ค๋ค. ๊ฒ๋ค๊ฐ ์ด๋ป๊ฒ ํ์ต ์๊ฐ๊ณผ ์ ํ๋๊ฐ ๋จ์ด ๋ฒกํฐ์ ์ฐจ์๊ณผ ํ์ต ๋ฐ์ดํฐ์ ์์ ์ด๋ค ์ํฅ์ ๋ฏธ์น๋์ง ์๊ธฐํด๋ณผ ๊ฒ์ด๋ค.
<์์ฝ>
๋จ์ด์ ์ ์ฌ์ฑ์ ๊ฐ์ง๊ณ ๋ฒกํฐ๋ฅผ ํํํ๊ณ ์ถ์๋ค.
์ด๋ฏธ์ ๋ณํ์ ๊ฐ์ syntatic (๊ตฌ๋ฌธ) ๊ท์น์ฑ์ ์ด๊ธฐ์ ๊ด์ฐฐ๋์์ง๋ง, ๋จ์ด์ ์ ์ฌ์ฑ์ ๊ตฌ๋ฌธ์ ๊ท์น์ฑ์ ๋์ด ์๋ฏธ์์๋ ์ฐพ์ ์ ์์๋ค. ์๋ฅผ ๋ค์ด, ์ - ๋จ์ + ์ฌ์ = ์ฌ์.
์ฆ, ๊ตฌ๋ฌธ์ + ์๋ฏธ์ ๊ท์น์ฑ์ ๋ชจ๋ ์ธก์ ํ๋ ํฌ๊ด์ ์ธ ์๋ก์ด vector representation์ ๋์์ธํ๊ณ , ์ด๊ฒ๋ค์ด ๋์ ์ ํ๋๋ก ํ์ต๋ ์ ์๋ ๊ฒ์ ๋ณด์ฌ์ค๋ค.
๋จ์ด ๊ฐ์ ์ ํ์ ๊ท์น์ ๋ณด์กดํ๋ ๊ฒ์ LSA๋ณด๋ค ๋ ์ข๊ฒ ๋์ค๊ฑฐ ์๋ ๊ฒ์ด ์ด์ ์ ๋ณด์ฌ์ก๊ธฐ์, ์ด ๋ ผ๋ฌธ์ ๋จ์ด์ ๋ถ์ฐ ํํ์ ์ด์ ์ ๋ง์ถ ๊ฒ์ด๋ค.
๋ค๋ฅธ ๋ชจ๋ธ ๊ตฌ์กฐ์ ๋น๊ตํจ์ ์ฐ๋ฆฌ๋ ์ฒ์์ผ๋ก computational ๋ณต์ก๋๋ฅผ ๋ชจ๋ธ์ ์์ ํ ํ์ตํ๊ธฐ ์ํด ์์ธ์คํด์ผํ๋ parameter์ ์๋ก ์ ์ํ๋ค. ๊ทธ๋ฆฌ๊ณ ์ฐ๋ฆฌ๋ computational complexity๋ฅผ ์ต์ํํ๋ฉด์ ์ ํ๋๋ฅผ ์ต๋ํํ๊ธฐ ์ํด ๋ ธ๋ ฅํ ๊ฒ์ด๋ค.
ํ์ต ๋ณต์ก๋(training complexity)๋

E๋ ํ์ต ํ์(training epochs), T๋ training set์ ๋ค์ด์๋ ๋จ์ด์ ์, Q๋ ๊ฐ ๋ชจ๋ธ architecture์ ์ํด ์์ธํ ์ ์๋จ
์ผ๋ฐ์ ์ผ๋ก E๋ 3~50, T๋ 10์ต๊น์ง๋ก ์ ํํจ
๋ชจ๋ ๋ชจ๋ธ์ ํ๋ฅ ์ ๊ฒฝ์ฌ ํ๊ฐ๋ฒ๊ณผ ์ค์ฐจ์ญ์ ๋ฒ์ ์ด์ฉํด ํ์ต๋๋ค
probabilistic feedforward neural network language model์ 'A neural probabilistic language model. Journal of Machine Learning Research' ์์ ์ ์๋๋ค. input, projection, hidden, output ์ธต์ผ๋ก ๊ตฌ์ฑ๋์ด ์๋ค.
Q = N P + N P H + H V

input -> projection ์ ์ด์ฉํ๋ W์ ํฌ๊ธฐ๋ (V x D)
projection -> hidden ์ ์ด์ฉํ๋ W์ ํฌ๊ธฐ๋ (N*D x H)
hidden -> output ์ ์ด์ฉํ๋ W์ ํฌ๊ธฐ๋ (H x V)
์ฌ๊ธฐ์ ์ฃผ๋ชฉํ ์ ์ projection์ linear ํ์ง๋ง, hidden์ non-linearํ๊ฒ ๋ง๋ค์ด์ค๋ค. ๊ทธ๋ฆผ์์ ๊ทธ๋ฅ ๊ฐ์ค์น์ ํฌ๊ธฐ์ ๋ํด์๋ง ๋ํ๋ด๋ ค๊ณ ์ด๋ ๊ฒ ์ ์ ๊ฒ์ด๊ณ hidden์ผ๋ก ๊ฐ ๋๋ ํ์ฑํ ํจ์๋ ๊ณ์ฐํด ์ฃผ์ด์ผ ํ๋ค.
Q์์ VxP๊ฐ ์๋๋ผ NxP์ธ ์ด์ ๋ ์ฌ์ค input์ one-hot vector๋ก ์ด๋ฃจ์ด์ ธ์๊ธฐ ๋๋ฌธ์ ๊ฐ์ค์น ๋ฐฑํฐ์ ํ์ ๊ฐ์ ธ์จ๋ค๊ณ ๋ณผ ์ ์๋ค. ๊ฒฐ๊ตญ ์ด์ ๊ฐ์์ธ D๊ฐ๋ฅผ ๊บผ๋ด์์ผํ๋๊น D๋งํผ ์ฐ์ฐ์ ์ํํ ๊ฒ์ด๊ณ , ๋จ์ด๊ฐ N๊ฐ๋๊น ๋ณต์ก๋๋ N x D ๋ผ๊ณ ๋ณผ ์ ์๋ค.
์ฌ๊ธฐ์ ๊ณ์ฐ์ ์ค์ด๋ ๋ฒ์ hierarchical softmax์ ์ฌ์ฉํ๋ฉด ๋๋ค.
๋ฑ์ฅํ๋ ๋น๋์ ๊ด๊ณ์๊ฒ ์ด์ง ํธ๋ฆฌ์์ level์ ์ค์ ํด์ฃผ๋ Huffman Tree๋ฅผ ์ด์ฉ.
๋จ์ด๋ค์ leaf๋ฅผ ๋๊ณ ๊ณ์ฐ

์ถ์ฒ : https://uponthesky.tistory.com/15
"asinine"๊ณผ "cost"์ ๊ฐ์ ๊ณ์ฐํ๋ ค๋ฉด
"asinine"๊ณผ row6 ๋ด์ ํ sigmoid ํจ์ ์ด์ฉ
๊ฐ์ด 0.24๋ผ๊ณ ํ๋ฉด row6์์ ์ค๋ฅธ์ชฝ์ผ๋ก ๊ฐ ํ๋ฅ ์ด 0.24, sigmoid ํจ์์ ํน์ง์ ๋ฐ๋ผ ์ผ์ชฝ์ผ๋ก ๊ฐ ํ๋ฅ ์ 1 - 0.24 =0.76 ์ด ๋๋ค.
"asinine"๊ณผ row4 ๋ด์ ํ sigmoid ํจ์ ์ด์ฉ
๊ณ์ฐํ ๊ฐ์ด 0.43์ด๋ผ ํ๋ฉด row4์์ ์ผ์ชฝ์ผ๋ก ๊ฐ ํ๋ฅ ์ 1 - 0.43 = 0.57
"asinine"๊ณผ row3 ๋ด์ ํ sigmoid ํจ์ ์ด์ฉ
๊ณ์ฐํ ๊ฐ์ด 0.68์ด๋ผ๋ฉด row3์์ ์ค๋ฅธ์ชฝ์ผ๋ก ๊ฐ ํ๋ฅ ์ 0.68
์ฆ : "asinine"์ ์
๋ ฅํ์ ๋ "cost"๋ฅผ ์ถ๋ ฅํ ํ๋ฅ ์ 0.76 0.57 0.68
์ด๋ฐ ์์ผ๋ก ๊ณ์ฐ ์์ ์ค์ฌ์ค๋ค ์ด์ง ํธ๋ฆฌ๋ก ๋ง๋ค์ด์ฃผ์๊ธฐ ๋๋ฌธ์ log2(V) ๋ก ์ค์ด๋ ๋ค
N๊ฐ window ์ง์ ์ ํ๊ณ๋ฅผ ๊ทน๋ณตํ๊ธฐ ์ํด ๊ณ ์๋์๋ค
๊ทธ๋ฆฌ๊ณ ์ด๋ก ์ ์ผ๋ก RNN ๋ชจ๋ธ์ด ์์ neural network ๋ณด๋ค ๋ณต์กํ ํจํด์ ํจ์จ์ ์ผ๋ก ํํํ ์ ์๋ค
Layer์ ๊ตฌ์ฑ์ {input layer, output layer, hidden layer} ์ด ์๋ค. NNLM๊ณผ ๋ฌ๋ฆฌ projection layer๊ฐ ์๋ค
์ฌ๊ธฐ์ special type์ time delay connection์ ์ด์ฉํด ์๊ธฐ ์์ ๊ณผ hidden layer๋ฅผ ์ด์ด์ฃผ๋ recurrent matrix๋ค.
๊ณผ๊ฑฐ๋ก๋ถํฐ์ ์ ๋ณด๊ฐ ์ด์ ์ hidden layer state์ ํ์ฌ input์ ๊ธฐ๋ฐ์ผ๋ก update๋๋ hidden state๋ก ํํ๋ ์ ์๋ค
Q = H x H + H x V
hidden(t-1) -> hidden(t) ์ ๊ณ์ฐ ๋ณต์ก๋ H x H
hidden -> output ์ ๊ณ์ฐ ๋ณต์ก๋ H x V
( input -> hidden ์ผ๋ก ๊ฐ ๋๋ input์ด one-hot vector ์ด๋๊น ์ฌ์ค ๊ฐ์ค์น(input์์ hidden์ผ๋ก ๊ฐ ๋ ๊ณฑํด์ง๋)์ ์ด๋ค ํ์ ๋ฝ์์ค๋ฉด ๋๋ ๊ฒ์ผ๋ก ๊ณ์ฐ X )
๊ณ์ฐ ๋ณต์ก๋๋ฅผ ๋ฎ์ถ๊ธฐ ์ํด 2๊ฐ์ ๋ชจ๋ธ์ ์ค๋ช
ํ ์ ์ํ๋ค
์ด ์ ์์๋ ๊ณ์ฐ ๋ณต์ก๋๊ฐ non-linear hidden layer์์ ์ฆ๊ฐํ๋ค
non-linear hidden layer๋ neural network๋ฅผ ๋งค๋ ฅ์ ์ผ๋ก ๋ณด์ด๊ฒ ํด์ฃผ๋ ๊ฒ์ด์ง๋ง, ๋ฐ์ดํฐ๋ฅผ neural network๋งํผ ์ ํํ๊ฒ ๋ฐ์ดํฐ๋ฅผ ํํํด์ค ์ ์์ ์ง ๋ชจ๋ฅด์ง๋ง ํจ์จ์ ์ผ๋ก ํ์ต์ด ๊ฐ๋ฅํ ๊ฐ๋จํ ๋ชจ๋ธ์ ์คํํด๋ณผ ๊ฒ์ด๋ค
context (๋ฐฐ๊ฒฝ : ์ฃผ๋ณ์ ๋จ์ด๋ค) ์ ์ด์ฉํ์ฌ Target word๋ฅผ ์์ธกํ๋ model
NNLM๊ณผ ๋น์ทํ๋ค
non - linear hidden layer๊ฐ ์ ๊ฑฐ๋๊ณ projection layer๊ฐ ๋ชจ๋ ๋จ์ด์ ๊ณต์ ๋๋ค. ๊ทธ๋์ ๋ชจ๋ ๋จ์ด๊ฐ ๊ฐ์ ์์น์ ์์ฌ๋๋ค. ( ๋ฒกํฐ ํ๊ท ํ )
standard bag-of-words model๊ณผ ๋ฌ๋ฆฌ ๋ฐฐ๊ฒฝ์ ์ฐ์์ ์ธ ๋ถ๋ฐฐ๋ ํํ์ ์ด์ฉํจ (Continuous distributed representation of the context)
=> standard bag-of-words model์ ๋ชจ๋ ๋จ์ด๋ฅผ bag์ ๋ด์์ context์ ๋ํ ๊ฐ๋
์ด ์์ง๋ง, CBOW๋ window ๊ฐ์๋ฅผ ์ ํด๋ ์ผ๋ก์จ ๋ฐฐ๊ฒฝ์ ๋ถ๋ฐฐ๋ฅผ ์ด์ฉํจ
์ค์ํ ๊ฒ์ Input Layer์ Projection Layer ์ฌ์ด์ ๊ฐ์ค์น matrix๋ NNLM๊ณผ ๊ฐ์ ๋ฐฉ์์ผ๋ก ๋ชจ๋ ๋จ์ด์ ๊ณต์ (shared)๋๋ค

Loss Function์ Cross Entropy๋ฅผ ์ด์ฉํด ํ์ต์ ํ๋ค
๊ณ์ฐ ๋ณต์ก๋
Q = N x D + D x Log2(V)
์ฌ๊ธฐ์ ๋ง๊ฐ !
Word Embedding ์ด๋ ?
ํน์ ๋ชจ๋ฅผ๊น๋ด ๋งํ๋ ๊ฒ์ด์ง๋ง..
one-hot vector ๊ฐ์ด sparse vector์ dense vector๋ก ๋ณํํด์ฃผ๋ ๊ณผ์ !
center word๋ฅผ ์ด์ฉํ์ฌ context word๋ฅผ ์์ธกํ๋ Model

CBow model ๋ณด๋ค ์ข์ ์ฑ๋ฅ์ ๋ณด์ธ๋ค๊ณ ์๋ ค์ก๋๋ฐ, ์ด๋ output์ ํ์ตํ ๋ window์ ํฌ๊ธฐ์ ๋ฐ๋ผ ์ค๋ณต์ ์ผ๋ก ํ์ตํ๋ ๊ฒฝ์ฐ๊ฐ ๋ง์์ ๊ทธ๋ ๋ค.
=> I am a boy you are a girl ์ ํ์ตํ ๋ window๊ฐ 2์ด๋ฉด am์ I๋ฅผ center word๋ก ๋ฐ์์ฌ ๋๋ ํ์ต์ ํ๊ณ , a์ boy๋ฅผ center word๋ก ๋ฐ์์ฌ ๋๋ ํ์ต์ ํ๊ธฐ ๋๋ฌธ์ ์ค๋ณต์ ํ์ต์ด ๋ง์์ ธ ์ข์ ์ฑ๋ฅ์ด ๋์ค๋ ๊ฒ์ผ๋ก ๋ณด์ธ๋ค
๊ณ์ฐ ๋ณต์ก๋
Q = C x (D + D x log2(V))
D : input -> hidden
D x Log2(V) : hidden -> output
์ฌ๊ธฐ์ C๋ maximum distance of the words
๊ตฌ๋ฌธ์ (syntactic), ์๋ฏธ์ (semantic)์ ์ด์ฉํ ๋ชจ๋ธ์ ๊ณต๋ถํ๋ค.
์ ๋ช
ํ neural network์ ๋น๊ต๋๊ฒ ๊ฐ๋จํ ๋ชจ๋ธ ๊ตฌ์กฐ๋ฅผ ๊ฐ์ง๊ณ ๋์ quality์ word vector์ ํ์ตํ ์ ์์๋ค.
๊ณ์ฐ ๋ณต์ก๋๊ฐ ์ค์ด๋ค๋ฉด์, ๋ ํฐ ๋ฐ์ดํฐ์
์์ ๋ ์ ํํ high - dimensional word vector์ ๊ณ์ฐํ ์ ์์๋ค.
๊ณต๋ถ๋ฅผ ํ ๋ด์ฉ์ด๋ฏ๋ก ์ ํํ์ง ์์ ์ ์๊ณ , ํน์ ์์ ๋ ๋ถ๋ถ์ด ์๋ค๋ฉด ๋งํด์ฃผ์ธ์~