์ค๋ฅ์ญ์ ํ๊ฐ ๋์ค๊ฒ ๋ ๊ณ๊ธฐ๊ฐ ๋ฌด์์ผ๊น?
No one on earth had found a viable wayto train MLPs good enough to learn such simple functions
์ง๊ตฌ์ ๊ทธ ๋๊ตฌ๋ ๊ทธ๋ฐ ๊ฐ๋จํ ๊ธฐ๋ฅ์ ๋ฐฐ์ฐ๋๋ก, MLP๋ฅผ ํ๋ จ์ํค๋ ํ๋ฅญํ ๋ฐฉ๋ฒ์ ์ฐพ์ง ๋ชปํ๋ค.
๊ฒฐ๋ก ๋ถํฐ ๋งํ์๋ฉด, ์ค๋ฅ์ญ์ ํ๋ฅผ ํตํด MLP๋ฅผ ํ์ต ์ํฌ ์ ์๋ค.
MLP์ ํ์ต์ ๋ณด๊ธฐ ์ , ๋จ์ธต๊ตฌ์กฐ์ ํผ์ ํธ๋ก ๋ถํฐ ์ด๋ป๊ฒ ํ์ต์ด ์ด๋ฃจ์ด์ง๋ ์ง ์ดํด๋ณด์.
์ด์ ๊ฐ์ AND๊ฒ์ดํธ๋ฅผ ํ์ต์ํจ๋ค๊ณ ํ์.
ํ์ต์ด๋ผ ํจ์ ์ฆ, ์ต์ ์ (weight)๊ฐ์ ์ฐพ๋ ๊ฒ์ด๋ค.
๋ค์๊ณผ ๊ฐ์ AND๊ฒ์ดํธ์ ์
๋ ฅ๊ณผ ์ถ๋ ฅ์ด ์์ ๋, ์ ์์ ๋์
ํ๊ฒ ๋๋ฉด ๋ค์๊ณผ ๊ฐ๋ค.
์ด๋ฅผ ํตํด ๊ตฌํ ์์ญ์ ์ขํํ๋ฉด์์ ๋ํ๋ด๋ณด์.
์ ์ ์ธ ์์ญ์ ๋ํ๋ด๊ณ ์ด๋ค์ด ๊ฒน์ณ์ง๋ ๋ถ๋ถ์ด ๋ฐ๋ก ์ ๋ต ๊ฐ ๋ ๊ฒ์ด๋ค.
ํด๋น ์์ญ์ ๋ง์กฑํ๋ ๋ ๋ชจ๋ AND๊ฒ์ดํธ๋ฅผ ์ ํํ๊ฒ ๋ํ๋ผ ์ ์๋ "์ ๋ต"์ด๋ผ๊ณ ํ ์ ์๋ค.
- ์ ๋ต ์์ญ ์์
์ด๋ฌํ ๊ฐ์ ์
๋ฐ์ดํธ๋ ๋ค์๊ณผ ๊ฐ์ ๋น์ฉํจ์๋ฅผ ํตํด ์ด๋ฃจ์ด์ง๋ค. (๋น์ฉํจ์๋ฅผ ๋ฏธ๋ถํ์ฌ ๊ฒฝ์ฌํ๊ฐ๋ฒ์ ์ํ)
- ๋น์ฐํ๊ฒ๋ ๋จ์ธต ๊ตฌ์กฐ๋ก๋ XOR์ ํํํ ์ ์๋ค. -> ๋ค์ธต๊ตฌ์กฐ๋ฅผ ์ฌ์ฉํ์!
๋ค์ธต๊ตฌ์กฐ์ ํผ์
ํธ๋ก ์ ํ์ต์ ์ค๋ฅ ์ญ์ ํ
๋ฅผ ํตํด์ ์ด๋ฃจ์ด์ง๋ค.
(์ค์ฐจ ์ญ์ ํ ๋๋ ์ค๋ฅ ์ญ์ ํ๋ก ๋ถ๋ฆฐ๋ค.)
๊ธฐ๋ณธ์ ์ธ weight๋ฅผ updateํ๋ ๊ณผ์ ์ ๊ธฐ์กด Linear resgression ๋ฐ logistic regression์์ ์ฌ์ฉํ ๋ฐฉ๋ฒ๊ณผ ๋์ผํ๋ค. ์ค์ฐจ๊ฐ ์ถ๋ ฅ๋ ์ด์ด๋ฅผ ํตํด ๋์จ ์์ธก๊ฐ๊ณผ ์ค์ ์ ๋ต๊ณผ์ ์ฐจ์ด์ธ ์ค์ฐจ(loss)๋ฅผ ์ฌ์ฉํ์ฌ weight๋ฅผ ๊ฐฑ์ ํด์ฃผ๋ ๊ฒ์ด๋ค.
์ฆ, ์ค์ฐจ ํจ์(์์คํจ์ ๋๋ ๋น์ฉํจ์)๋ฅผ ๋ฏธ๋ถํ ๊ฐ์ ๋นผ์ฃผ๋ ํ์์ ํตํด ๊ฐฑ์ ํ๋ Gradient Descent
์ ์ํํ๊ฒ ๋๋ค.
์ฌ๊ธฐ์ ์ ์ค์ฐจ์ญ์ ํ์ธ์ง๋ฅผ ์๊ฐํด๋ณด์.
๊ฒฐ๊ตญ ์ด๋ฌํ ์ค์ฐจ๋ ์ผ๋ จ์ MLP๋ฅผ ์ญ ํต๊ณผํ๋ฉฐ ๊ฒฐ๊ณผ๋ก ๋์จ ์์ธก๊ฐ์ ๋ํ ์ค์ฐจ๋ฅผ ๋งํ๋ค.
์ด๋ฌํ ์ค์ฐจ๋ฅผ ํ์ธํ๊ณ , ํด๋น ์ค์ฐจ๋ฅผ ํตํด์ ๊ฐ node์ weight๊ฐ์ ์ ์ ํ๊ฒ updateํ๋ ๊ณผ์ ์ด ํ์ํ๋ค.
์ฆ, ๋ง์ง๋ง output layer๊น์ง ์ ๋ฌ๋ ๊ฐ์ผ๋ก ์ค์ฐจ๋ฅผ ํตํด, ์์ชฝ์ ์๋ node๋ค์ weight์ update์ ์ฌ์ฉ(์ ํ)๋๋ ๊ฒ์ด๋ค. ๊ทธ๋ ๊ธฐ์ ์ค์ฐจ๊ฐ ์์ผ๋ก(์ญ์ผ๋ก) ์ ํ ๋๋ฏ๋ก ์ค์ฐจ ์ญ์ ํ๋ผ ๋ถ๋ฆฐ๋ค.
๋ค์ ๋์ค๊ฒ ์ง๋ง, ๊ณ์ฐ ๊ทธ๋ํ
์ ๋ฐฉ๋ฒ์ผ๋ก ํจ์ฌ ์ฝ๊ฒ ์ค์ฐจ ์ญ์ ํ๋ฅผ ์ํํ ์ ์๋ค.
์์ชฝ์์ ์ํ๋ weight์ ๊ฐ์ ๋งจ ๋ง์ง๋ง์ output์ผ๋ก ๊ตฌํด์ง ๊ฒฐ๊ณผ๋ฅผ ํตํด ์์๋ธ ์ค์ฐจ๋ฅผ ๋ฐํ์ผ๋ก ์
๋ฐ์ดํธ ํ๋ ๊ฒ์ ์ฌ๊ฐ ์ด๋ ค์ด ์ผ์ด ์๋๋ค.
๊ฒฐ๊ตญ ํด๋น ์ค์ฐจ์ weight๊ฐ์ ๊ด๊ณ๋ฅผ ๋ํ๋ด๋ ๋น์ฉํจ์
or ์์คํจ์
๋ฅผ ํธ๋ฏธ๋ถํ ๊ฐ์ ํตํด updateํ๋ ๊ฒ์ด๊ธฐ ๋๋ฌธ์ด๋ค.
์ด๋ฅผ MLP์ ์๋ก ์ดํด๋ณด์.
์๋ 3๊ฐ์ง ๊ณผ์ ์ ๊ฑฐ์น๋ค.
1) ์ ๋ฐฉ ๊ณ์ฐ
2) ๋น์ฉํจ์ ์ ์(MSE)
3) ๊ฐ์ค์น ๊ณ์ฐ(Update)
1) ์ ๋ฐฉ ๊ณ์ฐ
- ์๋์ธต์ ์ ๋์
z
, ์ถ๋ ฅ์ธต์ ์ ๋์o
๋ผ๊ณ ํ๋ค.- ์๋์ธต์
z
์ ์ ๋ฌ๋๋ ๊ฐ์ ์ด์ ์ ๋ ฅ์ธต์์์ ์ ๋๋ค์ ๊ฐ() x ๊ฐ์ค์น()์ ํฉ์ด๋ค.- ์ถ๋ ฅ์ธต
o
์ ์ ๋ฌ๋๋ ๊ฐ์ ์ด์ ์๋์ธต์์์ ๊ฐ() x ๊ฐ์ค์น()์ ํฉ์ด๋ค.
2)๋น์ฉํจ์ ์ ์(MSE)
- ๋น์ฉํจ์(J)๋ก๋ ์ฐ๋ฆฌ์๊ฒ ์ต์ํ MSE๋ฅผ ์ด๋ค.
๋น์ฉํจ์๋ ๊ฒฐ๊ตญ, ์์คํจ์(L)๋ฅผ ํ๊ท ๋ธ ๊ฐ์ด๋ฏ๋ก ๋ค์๊ณผ ๊ฐ์ด ํํ๋๋ค.
3)๊ฐ์ค์น ๊ณ์ฐ(Update)
- ๊ฐ์ค์น ๊ณ์ฐ์ด๋ ๊ฒฐ๊ตญ, gradient descent๋ฅผ ์ํํ๋ ๊ฒ์ด๋ค.
- ์ถ๋ ฅ์ธต์ ์ฐ๊ฒฐ๋ ๊ฐ์ค์น w์, ์ถ๋ ฅ์ธต์ ์ฐ๊ฒฐ๋ ๊ฐ์ค์น v๋ฅผ ๋๋ ์ ์ ๋ฐ์ดํธํ๋ค.
์ ์์ฒ๋ผw
์v
์ ๋ํด์ ๋น์ฉํจ์๋ฅผ ๊ฐ๊ฐ ํธ๋ฏธ๋ถํ์ฌ ๊ฐ์ ๊ตฌํ๋ฉด ๋๋ค.
ํ์ง๋ง ์ด ๊ณผ์ ์ด ์๋นํ ๋ณต์กํ๋ค.
์๋ ์์ ๋ณด์.
๊ทธ๋๋ง v
๋ ์ค์ฐจ๊ฐ ๊ณ์ฐ๋ ์ต์ข
์ถ๋ ฅ์ธต๊ณผ ๊ฐ๊น์์ ๋ ์ด๋ ต์ง๋ง, w
๋ ์์ผ๋ก(๋จผ์ ์ํ๋ ์ชฝ)๊ฐ์๋ก ์ค์ฐจ๋ฅผ ๊ตฌํด์ง ๋ ์ด์ด์๋ ๋ฉ์ด์ ธ, ๊ณ ๋ คํด์ผํ ์ ๋์ด ๋ ๋ง์์ง๊ธฐ์ ๋์ฑ ๋ณต์กํด์ง๋ค.
- V
- W
๋๋ฌด ์ด๋ ต๋ค. โ ๊ณ์ฐ ๊ทธ๋ํ๋ฅผ ์จ๋ณด์.
Linear Regression์ ์์๋ก ์ค์ฐจ์ญ์ ํ๊ฐ ์ด๋ป๊ฒ ์ด๋ฃจ์ด ์ง๋์ง ์ดํด๋ณด์.
์๋์ ๊ฐ์ ์ฌ์ง์ ๊ณ์ฐ ๊ทธ๋ํ๋ผ๊ณ ํ๋๋ฐ, ์ด์ ๊ฐ์ ๊ณ์ฐ ๊ทธ๋ํ๋ฅผ ์ด์ฉํ๋ฉด ์ฝ๊ฒ ์ค์ฐจ์ญ์ ํ๋ฅผ ๊ณ์ฐํ ์ ์๋ค.
ํจ์์ ์๋ฅผ ํตํด ์์๋ณด์.
๊ธฐ๋ณธ์ ์ธ Linear Regression๊ณผ์ ์ ๋ค์๊ณผ ๊ฐ๋ค.
- ์์ธกํ ๋ฅผ ์ ๋ต ๊ฐ์์ ๋บ๋ค. (์ค์ฐจ๋ฅผ ๊ณ์ฐ)
- ํด๋น ์ค์ฐจ๋ฅผ ์ ๊ณฑํ๋ค. (์ค์ฐจ์ ๋ฐฉํฅ์ฑ์ ์ ๊ฑฐ(-,+))
- ํด๋น ์ค์ฐจ์ weight์ฌ์ด์ ๊ด๊ณ๋ฅผ ๋ํ๋ด๋ ํจ์๊ฐ ๊ตฌํด์ง๋ค.(Loss Function)
- ํจ์๋ฅผ ๋ฏธ๋ถํ ๊ฐ์ ์ ๋นํ lr๋ฅผ ๊ณฑํ์ฌ weight๊ฐ์์ ๋นผ์ค๋ค. (weight ์ ๋ฐ์ดํธ)
๋ค์๊ณผ ๊ฐ์ ์ ๋ฐฉ๊ณ์ฐ์ ์ํํ๋ฉฐ, Linear regression์ด ์งํ๋ ๊ฒ์ด๋ค.
๋ชจ๋ธ์ ์ ์ํ๊ณ , ์์ธกํ ๊ฒฐ๊ณผ์์ ์ค์ ๊ฐ๋ฅผ ๋บ ํ ์ ๊ณฑํ๋ค.
๊ฒฐ๊ณผ์ ์ผ๋ก weight๋ฅผ ์
๋ฐ์ดํธํ๊ธฐ ์ํด์๋ ์ ๊ฐ์ด ํ์ํ๋ค. (Loss function์ ํธ๋ฏธ๋ถ ํ ๊ฐ)
์ด ๊ฐ์ Chain Rlue์ ์ฌ์ฉํ๋ฉด ์ฝ๊ฒ ๊ตฌํ ์ ์๋ค. ์์ ๋ณด๋ฉด ์ด๋ ต์ง ์๋ค.
์ฒด์ธ๋ฃฐ์ด๋, ๋ง์น ์ฒด์ธ์ฒ๋ผ ๋ฏธ๋ถ๊ฐ๋ค์ด ์๋ก ์ฝํ ์๋ค๋ ๊ฒ์ธ๋ฐ, ์ด๋ค ๋ณ์์ ๋ณํ์จ์ ๊ตฌํ๋ ค๋ค๋ณด๋ 3๋ฒ์ด ์ฌ์ฉ๋๊ณ , 3๋ฒ 2๋ฒ์ด ์ฌ์ฉ๋๊ณ , 2๋ฒ์ ๊ตฌํ๋ ค๋ 1๋ฒ์ด ์ฌ์ฉ๋๋ ๊ฒ์ ๋งํ๋ค.
์ ๋ฐฉ๊ณ์ฐ ์์ ๋ฏธ๋ฆฌ ํธ๋ฏธ๋ถ๊ฐ์ ์ ์ฅํด ๋ ํ, ํด๋น ํธ๋ฏธ๋ถ ๊ฐ์ ์ด์ฉํด์ ๊ฐ๋จํ๊ฒ ํธ๋ฏธ๋ถ๊ฐ(update์ ํ์ํ ๊ฐ)์ ์์๋ด๊ณ , ์ด๋ฅผ ํตํด ์ค์ฐจ์ญ์ ํ๋ฅผ ์ํํ ์ ์๋๊ฒ์ด๋ค.
์ฒด์ธ๋ฃฐ์ ์ฌ์ฉํ๋ฉด ์๋์ ๊ฐ์ด ์ด์ ๊ฐ์ ํตํด์ ์ฝ๊ฒ ๊ตฌํ๊ณ ์ํ๋ ์ธต์ "์ค์ฐจํจ์์ ๋ฏธ๋ถ๊ฐ" ์ฆ, update์ ํ์ํ ()๋ฅผ ๊ตฌํ ์ ์๋ ๊ฒ์ด๋ค.
1) ์ ๋ฐฉ ๊ณ์ฐ ์, ๋ฏธ๋ฆฌ ํธ๋ฏธ๋ถ ๊ฐ(๋ณํ๋)์ ๊ตฌํด๋๋ค.
2) ์ ๋ฐฉ ๊ณ์ฐ ์, ๊ตฌํ ํธ๋ฏธ๋ถ ๊ฐ์ ํตํด, ์ ๋ํ ์ ๋ณํ๋์ ๊ตฌํ๋ค.![]
3) ์ ๋ํ ์ ๋ณํ๋์ ํตํด ์ต์ข ๊ตฌํ๊ณ ์ ํ๋ ์ ๋ํ ์ ๋ณํ๋์ ๊ตฌํ ์ ์๋ค.