๊ธฐ์ธ๊ธฐ ์์ค
์ ๋ฌธ์ ๋ part13. ์ค์ฐจ์ญ์ ํ์ ๊ณผ์ ์์ ์ด๋ฌํ ๋ฌธ์ ๊ฐ ๋ฐ์ํ๋ค.
์ค์ฐจ ์ญ์ ํ์ ๋ํด์ ์๊ฐํด๋ณด์.
๋จ์ํ๊ฒ ์ค์ฐจ์ญ์ ํ๋ฅผ ์ฌ ์ ๋ฆฌํ๋ค๋ฉด, ์ต์ข ์ ์ผ๋ก ๋์จ ๋ฅผ ํธ๋ฏธ๋ถํ ๊ฐ์ ๊ณ์ํด์ ๋ค๋ก ๋ฏธ๋ถ ๋ ๋ฏธ๋ถํ์ฌ update์ ์ฌ์ฉํ๋๋ก ์ ๋ฌํ๋ ๋ฐฉ์์ด๋ค.
๐ฅ ํ์ง๋ง ์ฌ๊ธฐ์ ๋ฌธ์ ๊ฐ ๋ฐ์ํ๋ค.
์ด๋ฌํ ์๋์ธต์ด ๊น์ด์ง๋ฉด ๊น์ด์ง์๋ก ์ต์ข ์ ์ธ Loss๊ฐ ํฌ๋๋ผ๋, ์์ชฝ์ ์ ๋ ฅ์ธต๊ณผ ๊ฐ๊น์ด ์๋์ธต์ weight์๋ "๋ฏธ๋ถ ๋ ๋ฏธ๋ถ ๋ ๋ฏธ๋ถํ ๊ฐ"์ด ์ต์ข ์ ์ผ๋ก ์ ๋ฌ๋๋ค.
์ฆ, update๊ฐ ์ฌ์ค์ ์ ์ผ์ด๋๊ฒ๊ณผ ๋์ผํ "๋งค์ฐ ์์ ๊ฐ"์ด ์ ๋ฌ๋๋ค.
์๋ฅผ ๋ค์ด๋ณด๊ฒ ๋ค.
ex)
100๊ฐ์ Layer๊ฐ ์๋ค๊ณ ๊ฐ์ ํ์ ๋, ๊ฐ ~์ ์ ๋ฐ์ดํธ๋ฅผ ์๊ฐํด๋ณด์.
100๋ฒ์งธ ์ ๊ฒฝ์ฐ, ๋ ๋ฏธ๋ถ์ด 1๋ฒ ๋ฐ์ํ๋ฏ๋ก ๊ทธ๋๋ก updateํด ์ค ๊ฐ์ด ์ ๋ฌ ๋ ๊ฒ์ด๋ค.
ํ์ง๋ง, 1๋ฒ์งธ ์ฆ, ์ ๋ ฅ์ธต๊ณผ ๊ฐ์ฅ ๊ฐ๊น์ด layer์ weight์ ๊ฒฝ์ฐ๋ Chain rule์ ์๊ฑฐํ์ฌ 100๋ฒ์ ๋ฏธ๋ถ์ด ์ํ๋ ๊ฒ๊ณผ ๊ฐ์ผ๋ฏ๋ก, ๊ทธ ๊ฐ์ด ๊นจ์ง๊ณ ์ง์์ง๊ณ ๋ถ์ ์ง๊ณ ์ธ์๋ง์ฌ ๋ค ๊ฒช์์ ๊ฒ์ด๋ค.
๊ทธ๋ ๊ธฐ์ ์์ชฝ์ผ๋ก ๊ฐ์๋ก weight์ update๊ฐ ์ ์์ ์ผ๋ก ์ํ๋์ง ์๋ ๊ธฐ์ธ๊ธฐ ์์ค
์ ๋ฌธ์ ๊ฐ ๋ํ๋๋ค.
์ด๋ฌํ ๊ธฐ์ธ๊ธฐ์ ์์ค์ด ๋ฐ์ํ๋ ์์ธ์ ๋ฌด์์ผ๊น?
๋ฏธ๋ถ์ด ์ผ์ด๋๋ ๊ฒ๋ง์ผ๋ก๋ ๊ฐ์ด ์ ์ ์์์ง๋ค๋ ๊ฒ์ ๋๋์ด ์์ ๊ฒ์ด๋ค.
๊ทธ๋ผ ๋์ฒด ์ด๋ค ํจ์๋ฅผ ๋ฏธ๋ถํ๊ธธ๋ ๊ฐ์ด ์ ์ ์์์ง๊ฒ ๋๊ฒ์ผ๊น?
์์, MLP๋ฅผ ๋ฐฐ์ธ ๋, ๊ฐ ์ ๋(Node)๋ค์ ํ๋์ ์ด์ง ๋ถ๋ฅ๊ธฐ๋ผ๊ณ ์ค๋ช
ํ๋ค.
์ฆ, ๊ธฐ๋ณธ์ ์ผ๋ก Sigmoidํจ์๋ฅผ ๋ง์ง๋ง์ ํต๊ณผํ๋ค๋ ๊ฒ์ด๋ค.
sigmoid ํจ์๋ฅผ ์ดํด๋ณด์.
- Sigmoidํจ์(ํ๋), Sigmoidํจ์์ ๋ฏธ๋ถ(์ฃผํฉ)
์ฃผํฉ์ ๊ทธ๋ํ๊ฐ ๋ณด์ด๋๊ฐ?
sigmoidํจ์๋ฅผ ๋ฏธ๋ถํ ์ ๊ฐ์ ์ต๋์น๊ฐ 0.25์ ๋ ๋ฐ์ ๋์ง ์๋๋ค.
์ธต์ ์์ผ๋ฉด ์์์๋ก update๋๋ ๊ฐ์ด 0.25 x 0.25 x 0.25 x 0.25 x 0.25 x 0.25 ....์ญ...
๊ทธ๋ ๊ฒ ์ ์ฐจ 0์ ์๋ ดํ๊ฒ ๋๊ณ , ๊ฒฐ๊ณผ์ ์ผ๋ก ์ ๋๋ก๋ ํ์ต์ด ์ด๋ฃจ์ด ์ง ์ ์๋ค.
์ด๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด์ ๋์จ ํจ์๊ฐ ๋ฐ๋ก ReLu
์ด๋ค.
๋ค์๊ณผ ๊ฐ์ ํ์ฑํจ์์ ์ข
๋ฅ๊ฐ ์ฌ๋ฌ๊ฐ์ง ์์ง๋ง, ๊ฐ์ฅ ๋ง์ด ์ฌ์ฉ๋๋ ReLu
์ ๋ํด์ ์ง์ค์ ์ผ๋ก ์ค๋ช
ํ๋ค.
ReLu
(์ดํ ๋ ๋ฃจ)ํจ์๋ ์
๋ ฅ๊ฐ์ด ์์์ผ ๊ฒฝ์ฐ, ์
๋ ฅ๊ฐ์ ์๊ด์์ด ํญ์ ๋์ผํ ๋ฏธ๋ถ ๊ฐ 1์ ๊ฐ์ง๋ค.
๋ฐ๋ผ์, ์
๋ ฅ๊ฐ๋ง ์์๋ผ๋ฉด Gradient๊ฐ์ด ์ฌ๋ผ์ง์ง ์๋๋ค.
ํ์ง๋ง ๋ณด๋ค์ํผ ์
๋ ฅ๊ฐ์ด ์์๋ผ๋ฉด ๋ฏธ๋ถ๊ฐ์ด ํญ์ 0์ด๋ฏ๋ก ๋ด๋ฐ์ด ๊ทธ๋๋ก ์ฃฝ์ด๋ฒ๋ฆฌ๊ฒ ๋๋ ๋ฌธ์ ๊ฐ ๋ฐ์ํ๋ค.(๋์ด์์ update๊ฐ ์ด๋ฃจ์ด ์ง์ง์์)
์ด๋ฌํ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํ ๋ฐฉ๋ฒ์ด ๋ฐ๋ก
Leaky ReLU
ํจ์์ด๋ค.
์์์ผ๋์ ์ถ๋ ฅ๊ฐ์ 0์ด ์๋ 0.001๊ณผ ๊ฐ์ ๋งค์ฐ ์์ ๊ฐ์ ์ฌ์ฉํด์, ์์๋ผ ํ๋๋ผ๋ Gradient
๊ฐ์ด 0์ ๋๋ฌํ์ง ์์ผ๋ฏ๋ก ๋ด๋ฐ์ด ์ฃฝ๋๊ฒ์ ๋ง์ ์ ์๋ค.
ํ์ง๋ง ์ค์ ๋ชจ๋ธ์๋ Leaky ReLU
๋ ์ ์ฌ์ฉํ์ง ์๋๋ค. ์ค๊น?
๋ ๋ฃจ์ ์ฐ์ฐ ์ฒ๋ฆฌ์์์ ๊ฐ๋จํจ(์๊ณ๊ฐ์ ์ํด 0๋ณด๋ค ํฌ๋ฉด y=x๊ฐ ๊ทธ๋๋ก, ์์ผ๋ฉด 0 ๋ฐํ)์ด๋ผ๋ ์ฅ์ ๋๋ฌธ์ด๋ค.
์ด๋ฌํ ๊ฐ๋จํจ์ ๋ฐํ์ผ๋ก ์๋๋ฉด์์ ๋งค์ฐ ๋น ๋ฅธ ๋ฐ๋ฉด, Leaky ReLU๋ 0๋ณด๋ค ์์ ๊ฐ์ ๋ํด์ ์์ ๊ฐ์ ํ์ดํผํ๋ผ๋ฏธํฐ๋ฅผ ๊ณฑํด ์ค์ผํ๋ฏ๋ก, ์๋๊ฐ ๋๋ฆฌ๋ค.
๊ณ ์ ์ ์ธ ๊ธฐ๊ณํ์ต๊ณผ ํ๋์ ์ธ ๊ธฐ๊ณํ์ต์ผ๋ก ๋๋๋ค.
์ฌ์ฉ์๊ฐ ์ง์ ํน์ง(feture)๋ฅผ ์ ์ ํ๊ณ , ๋ถ๋ฅ๊ธฐ๋ง ์ ํํ์ฌ ํ์ต์์ผฐ๋ค.
๋ฐ์ดํฐ ๋ฒ ์ด์ค ๊ตฌ์ถ ๐ ์ฌ์ฉ์๊ฐ ์ง์ ํน์ง์ ์ค๊ณ ๐ ๋ถ๋ฅ๊ธฐ ๋ชจ๋ธ์ ์ ํ ๐ ๋ชจ๋ธ ํ์ต ๐ ํ๊ฐ
ํ๋์ ์ธ ๊ธฐ๊ณํ์ต์ ํน์ง์ ์ฌ์ฉ์๊ฐ ์๋ ๋ชจ๋ธ์ด ์ง์ ์ค๊ณํ๋ค.
์ฆ, ๋ฐ์ดํฐ ๋ฒ ์ด์ค ๊ตฌ์ถ ๐ ๋ถ๋ฅ๊ธฐ ๋ชจ๋ธ ์ ํ ๐ ํน์ง ์ค๊ณ ๋ฐ ํ์ต ๐ ์ฑ๋ฅ ํ๊ฐ