๋ค์ค๋ถ๋ฅ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๋ Softmax ํจ์์ ๋ํด์ ์์๋ณด์.
ํน์ง์ ์ ํ๋ถํฐ ์ดํด๋ณด๋๋ก ํ๋ค.
ํน์ง์ ์ ํ์ ๋ค์๊ณผ ๊ฐ์ด 3๊ฐ์ง๋ก ๋ถ๋ฅ๋๋ค.
๊ธฐ์กด ๋ก์ง์คํฑ ํ๊ท๋ฅผ ๋ค์ ์ดํด๋ณด์.
์ด๋ ์ด์ง ๋ถ๋ฅ๊ฐ ๊ฐ๋ฅํ๋๋ก ํ๋ ๋ชจ๋ธ์ด์๋ค.
๋ก์ง์คํฑ ํ๊ท๋ ์๊ทธ๋ชจ์ด๋ ํจ์์ ์์์ ์ฌ์ฉํ๋ฉฐ, ์ด๋ฌํ ์๊ทธ๋ชจ์ด๋์ ์ค์ฐจ๋ฅผ ํํํ๊ธฐ ์ํด์ ๋น์ฉํจ์๋ BCE๊ฐ ์ฌ์ฉ๋์๋ค.
ํ์ ์ด A, B, C๋ก ์ด๋ฃจ์ด์ง๋ ๋ฌธ์ ๋ฅผ ์ดํด๋ณด์.
์..๊ณต๋ถ์๊ฐ์ด 30์๊ฐ์ด๊ณ ๊ฒฐ์์ผ์ด 2๋ผ๋ฉด A๋ฅผ ๋ฐ๊ณ ๊ณต๋ถ์๊ฐ 40์๊ฐ์ ๊ฒฐ์์ผ์ด 0์ด๋ผ๋ฉด A๋ฅผ ๋ฐ๋ ๊ฒ์ด ๋ณด์ธ๋ค..
30์๊ฐ ์น๊ตฌ๋ ๋งค์ฐ ๋๋ํด๋ณด์ด๋ ํจ์ค..๋ณธ์ธ์ ์ํฉ์ ๋น๋์ด ๋ดค์ ๋, ํ์ฌ ๊ฒฐ์์ด 0์ด๋ฏ๋ก 40์๊ฐ์ ๊ณต๋ถํ๋ค๋ฉด ๋ฅ๋ฌ๋์์ A๋ฅผ ๋ง์ ์ ์๋ ๊ฒ์ธ๊ฐ..?
ํ๋์ Linearํ ์ด์ง๋ถ๋ฅ๋ฅผ ์ํํ๋ ๋ก์ง์คํฑ ํ๊ท๋ก๋ ์ ๋ ์ ๋๋ก ๋ ๋ถ๋ฅ๋ฅผ ํ ์ ์์ ๊ฒ์ ๋ณด์ธ๋ค.
์ฌ์กฑ์ ์ง์ด์น์ฐ๊ณ ๋ค์ ๋ฌธ์ ๋ก ๋์์๋ณด์.
sigmoid ํจ์๋ 3๊ฐ๋ฅผ ๋ถ๋ฅํ๋ ๊ฒฐ๊ณผ์ ๊ฐ์ด ๊ฐ๊ฐ 0~1์ ๊ฐ ์ฌ์ด๋ก ๋์ฌ ๊ฒ์ด๋ค.
A, B, C๊ฐ ์์ ๋ A์ผ ํ๋ฅ 0.8 / B 0.6 / C 0.4์ ๊ฐ์ด ๋ง์ด๋ค.
์ด๋ฅผ softmax์์ผ๋ก ๋ณ๊ฒฝํ๋ค๋ฉด ์ด๋ค์ ์ ๋ถ ๋ํ์ ๋์ ๊ฐ์ด 1์ด ๋๋๋ก ๋ง๋๋ ๊ฒ์ด๋ค. A 0.4 / B 0.33 / C 0.22 ์ ๊ฐ์ด ๋ง์ด๋ค.
์ดํ ํ๋ฒ์ ์์ ์ ๋ ์ํํ๋ค. ์ด๋ ๊ฒํด์ A๋ผ๊ณ ํ๋ณ๋๋ ๊ฒ์ด ์๋๋ผ, ํ๋ณ์ ์ํด์๋ ์ํซ์ธ์ฝ๋ฉ์ ํด ์ค ํ์๊ฐ ์๋ค.
์ํซ์ธ์ฝ๋ฉ์ด๋ ์ฐ๋ฆฌ๊ฐ ๊ฐ, ๋๋, ๊ณ ์์ด, ํธ๋์ด๋ฅผ ๋ถ๋ฅํ๋ค๊ณ ์๊ฐํด๋ณด์.
์ปดํจํฐ์๊ฒ ๋ค์ง๊ณ ์ง "๊ฐ" ๋ผ๋ ํ๊ธ ๋จ์ด๋ฅผ ์
๋ ฅํ๊ณ , A, B, C ์ซ์ ๊ฐ์ ๋ณด๊ณ ์ด๋ฅผ A์ผ์ง B์ผ์ง C์ผ์ง ๋ง์ถฐ๋ณด๋ผ๊ณ ํ๋ค๋ฉด 0๊ณผ1์ ์ธ์์ ์ปดํจํฐ๋ ์ด๋ฅผ ์ดํดํ์ง ๋ชปํ ๊ฒ์ด๋ค.
๋ฐ๋ผ์ ์ปดํจํฐ๊ฐ ์ดํดํ ์ ์๋ ์ธ์ด๋ก, ์ฆ ์ฝ๊ฒ ์ฒ๋ฆฌํ ์ ์๋ ์ธ์ด(์ซ์)๋ก ๋ฐ์ดํฐ๋ฅผ ๋ณ๊ฒฝํด์ฃผ๋ ๊ฒ์ด ํ์ํ๋ค.
์ด๋ฌํ ๊ณผ์ ์ ๋ฐ๋ก ์ํซ์ธ์ฝ๋ฉ์ด๋ผ๊ณ ํ๋ค.
๊ฐ = [1 0 0 0]
๋๋ = [0 1 0 0]
๊ณ ์์ด = [0 0 1 0]
ํธ๋์ด = [0 0 0 1]
ex.) ๋ฐ์ดํฐ๊ฐ A 0.4 / B 0.33 / C 0.12 / D 0.10 ์ผ๋, ์ํซ ์ธ์ฝ๋ฉ ์ํ๊ฒฐ๊ณผ๋ [1 0 0 0]์ผ๋ก ์ต์ข ์ ์ผ๋ก ๊ฐ๋ก ํ๋ช ๋๋ค.
์ด๋ฌํ ์ํซ ์ธ์ฝ๋ฉ๋ ์ํ๊ฐ ๋์ผ์ง๋ง ์ ๋ต์ ๋ง์ท๋์ง, ๋ชป ๋ง์ท๋์ง๋ฅผ ํ๋จํ์ฌ ์ค์ฐจ๋ฅผ ๊ณ์ฐ ํ ์ ์์ ๊ฒ์ด๋ค.
(์ ๋ต ๋ฐ์ดํฐ๊ฐ ์ด๋ฏธ ์ํซ ๋์ด์์ผ๋ฏ๋ก ์ํซ ๋์ง์์ Lawํ ๋ฐ์ดํฐ๋ฅผ ์ค์๋ ํ๋จ์ ๋ชปํ๋ค๋ ๋ป)
cost๋ผ๊ณ ์ ํ์์ง๋ง, ํ๋์ ๊ฐ์ ๋ํด์ ํ์ฌ ์ค์ฐจ๋ฅผ ๊ตฌํ๋ ๊ฒ์ด๋ฏ๋ก Loss Function์ ๊ฐ๊น๋ค.
๋ก์ง์คํฑ ํ๊ท๋ฅผ ์ํํ ๋ BCE๋ฅผ ๋น์ฉํจ์๋ก ์ฌ์ฉํ๋ค.
๋ณ๋ฐ ๋ค๋ฅด์ง์๋ค. ๋จ์ํ ์์ ์ด์ง์ ๋ปํ๋ Binary๊ฐ ๋น ์ก์ ๋ฟ์ด๋ค.
์ฌ์ค์ Binary Cross์์์์ 2๊ฐ ํด๋์ค ๋ถ๋ฅ๋ฅผ ์ํ i๋ฅผ 2๋ฒ๋ง ์ํํ๋ฉด Binary Cross Entropy์ ์๊ธฐ๊ณผ ๋์ผํ๋ค๋ ๊ฒ์ ํ ์ ์๋ค.
๋น์ฉํจ์๋ ๋ฐ๋ผ์ ๋ค์๊ณผ ๊ฐ์ด ๊ตฌํ ์ ์๋ค.
์ด์ Gradinet Descent๋ฅผ ํตํด ์ค์ฐจ๋ฅผ ์ต์ํ ์์ผ๋ณด๋๋ก ํ์.
๊ธฐ์กด logisth regression๊ณผ ๋ณ๋ฐ ๋ค๋ฅด์ง ์๋ค. w์ ๋ํด์ ํธ๋ฏธ๋ถ์ ์ํํ๊ณ , ์ ์ ํ lr๋ฅผ ๊ณฑํด์ ๊ฐ์ ์
๋ฐ์ดํธ ์ํจ๋ค.
๋ง์ฝ ์์ ์ธ์ฐ๋ ๊ฒ์ด ํ์ํ๋ค๋ฉด ์ด ppt์ ์์ ์ธ์ฐ๋๋กํ์.