์ด์ ๊น์ง๋ ์ ํํ๊ท๋ก ์์ธก
์ ์ํํ๋ ๋ชจ๋ธ์ ๋ง๋๋ ๋ฐฉ๋ฒ์ ๊ณต๋ถํด ๋ณด์๋ค.
์ด๋ฒ์๋ ์ฐธ๊ณผ ๊ฑฐ์ง, YES์ NO๋ฑ 2์ง๊ฐ์ผ๋ก ๋ถ๋ฅ
ํ๋ ๋ชจ๋ธ์ ๋ง๋ค์ด๋ณด๋๋ก ํ๋ค.
- ์ด์ง๋ถ๋ฅ์ ์
+) ๐ ๊ธ์ ๋ค์ด๊ฐ๊ธฐ ์ , ์ฐธ๊ณ ์ฌํญ
- ์ฐธ == true == positive / ๊ฑฐ์ง == false == negative
์ด๋ค์ ๊ธ์์ฐ๋ค๋ณด๋ ๊ณ์ ํผ๋ํด์ ์ฌ์ฉํ๊ฒ ๋๋, ์ด์ง๋ถ๋ฅ์ด๋ฏ๋ก ์ด๋ค์ ๋ค ๊ฐ์ ๋ง์ด๊ตฌ๋ ์๊ฐํ๋ฉด ๋๋ค.
์ด์ ์ ๊ณต๋ถํ Linear Regression์ ๋ค์ ์๊ฐํด๋ณด์.
Linear์ ์ฆ ๊ทธ๋ํ์ ๊ฐํ์ด 1์ฐจ ํจ์๋ก์จ ์ ํ์ ์๋ฏธํ๋ค. (์ง์ )
๊ทธ๋ผ Rogistic์ ์ด๋ค ๊ทธ๋ํ์ ๊ฐํ์ ๊ฐ์ง๊น?
๋ฏธ๋ฆฌ ๋ณด์๋ฉด Sigmoid
ํจ์ ๊ทธ๋ํ๋ฅผ ์ฌ์ฉํ๋ค.
- ์๊ทธ๋ชจ์ด๋ ํจ์
๊ทธ๋ ๋ค. ์๋ฌด๋ฆฌ๋ด๋ ์ง์ (Linear)์ ์๋ ๊ฒ ๊ฐ๋ค... ๊ทธ๋ ๊ธฐ์ Rogistic์ด๋ผ ๋ถ๋ฅธ๋ค.
๊ทธ๋ผ Logistic Rregression์ด๋ ๋ฌด์์ผ๊น?
Introduction์์ ์ด๋ฏธ ๋ต์ ๋งํ์ง๋ง, ์ฐธ๊ณผ ๊ฑฐ์ง์ ๋ถ๋ฅํ๊ธฐ ์ํ ๊ณผ์ ์ด๋ค.
์ด๋ฌํ ๋ก์ง์คํฑ ํ๊ท๋ฅผ ํตํด์ ์ฐ๋ฆฌ๋์ด์ง ๋ถ๋ฅ
ํ๋ ๋ชจ๋ธ์ ๋ง๋ ๋ค.
- ์ด์ง ๋ถ๋ฅ์ ์ต์ ๋ชจ๋ธ์ ๋ง๋๋ ๊ณผ์ ์ด
Logistic Regression
์ด๊ณ , ์ด๋ฅผ ํตํด ๋ง๋ค์ด ์ง ๊ฒ์ดModel
์ด๋ค.
์ ์ด์ ์ด๋ฌํ ํจ์๋ฅผ ์ฌ์ฉํ๋ ์ด์ ๋ฅผ ์์๋ณด๋๋ก ํ์.
๊ทธ๋ฅ ์ฝ๊ฒ ์ด์ง๋ถ๋ฅ์๋ Linear๋ฅผ ๊ทธ๋๋ก ์ฌ์ฉํ๋ฉด ์ ๋๋๊ฐ?
๊ทธ๋. ๋น์ฐํ ์๋๋๊น Rogistic์ ์ฐ๋ ๊ฒ์ด๋ค.
๋ค์ ์์๋ฅผ ๋ณด์.
๊ณต๋ถ์๊ฐ์ ๋ฐ๋ฅธ ๊ณผ๋ชฉ์ด์ ์ฌ๋ถ(fail, pass)๋ ๊ฐ์ง๋ฅผ ํ๋จํ๋ ๋ถ๋ฅ๊ธฐ๋ฅผ ๋ง๋ ๋ค๊ณ ๊ฐ์ ํ์.
ํ์ต์ ์ํค๊ธฐ ์ํ ์
๋ ฅ ๋ฐ์ดํฐ
๋ ์ผ์ชฝ๊ณผ ๊ฐ๊ณ , ์ด๋ฅผ ์ขํ ํ๋ฉด์์ ํํํ๋ค๋ฉด ์ค๋ฅธ์ชฝ๊ณผ ๊ฐ์ ๊ฒ์ด๋ค.
์ด๋ค์ ์ ํํํ ์ ์๋ ์ต์ ์ ์ง์ (Linear)์ ๊ทธ์ด๋ณผ ์ ์๊ฒ ๋๊ฐ?
์ด์ฐ์ ์ฐ ์ ์ ๊ทธ์๋ค๋ง...์ ํํํ๋ค๊ณ ํ ์ ์์๊น?
์ด์ง ๋ถ๋ฅ
์ด๋ฏ๋ก 0๋๋ 1์ด๋ผ๋ ๊ฐ๋ง ๋์ค๋๋ก ํด์ผํ๋ค. ๋ฐ๋ผ์ ๊ฒฐ๊ณผ๋ ์ค๊ฐ๊ฐ์ธ 0.5๋ฅผ ๊ธฐ์ค์ผ๋ก ๋ถ๋ฅํ๋ค.
(์ฆ, ๊ฒฐ๊ณผ()๋ ์ค๊ฐ์ด ์๋ค)- ์
์ ํ ๋ชจ๋ธ
์ ํ๋ ๋ง๋ค์๊ณ , ๊ณต๋ถ์๊ฐ()๋ฅผ ๋ชจ๋ธ์ ๋์ ํ์ ๋, ํด๋น ๊ฐ์ด 0.5์ด์์ด๋ฉด ํฉ๊ฒฉ(1)๋ก 0.5๋ฏธ๋ง์ด๋ฉด ๋ถํฉ๊ฒฉ(0)์ผ๋ก (ํฉ๊ฒฉ ์ฌ๋ถ)๋ฅผ ๊ฒฐ์ ํ๋ค. (๊ฒฐ๊ณผ()๋ ์ค๊ฐ์ด ์๋ค)
๊ณต๋ถ์๊ฐ (17)์ ์ ์ ํ ๋ชจ๋ธ
์ ์ ์ฉํ์ ๋, ์์ฌ์์ฌํ๊ฒ 0.53์ ๊ฐ์ผ๋ก 0.5์ด์์ ๊ฐ์ด ๋์๋ค. ๋ฐ์ดํฐ๋ฅผ ์ ๋ฐ์ํ๋ ๊ฒ ๊ฐ์ด ๋ณด์ธ๋ค!
ํ์ง๋ง, ์ฌ๊ธฐ์ ์๋ก์ด ๋ฐ์ดํฐ ์ํ์ด ํ๋ ๋ ์ถ๊ฐ๋๋ค๊ณ ์๊ฐํด๋ณด์. ๊ทธ๋ผ ์ฐ๋ฆฌ๋ ์ด๋ฌํ ์ถ๊ฐ๋ ๋ฐ์ดํฐ๋ฅผ ๋ฐ์ํด์ผ ํ๋ฏ๋ก ๊ทธ๋ํ๋ฅผ ์ฝ๊ฐ update
ํด ์ฃผ์ด์ผํ ๊ฒ์ด๋ค. ์ด๋ฌํ update
๋ Linear Regression
์ ๊ณผ์ ์ ๊ฑฐ์น๋ค.
- 17์๊ฐ์ด๋ฉด ํฉ๊ฒฉ์ ํ๋๋ฐ, ์ด์ ๋ fail์ด ๋์ด์ผ ํ๋ค??
๊ทธ๋ฆผ์์ ๋ณด๋ฏ, ๊ณต๋ถ์๊ฐ (17)์ update
๋ ์ ์ ํ ๋ชจ๋ธ
์ ์ ์ฉํ์ ๋, ์ด์ ๋ 0.455์ ๊ฐ์ผ๋ก 0.5๋ฏธ๋ง์ ๊ฐ์ด ๋์จ๋ค.
์ค์ ๋ก 17์๊ฐ์ ๊ณต๋ถํ๊ณ ํฉ๊ฒฉ
ํ ํ์์ด์ง๋ง, ์ ๊ทธ๋ํ๋๋ก ์๊ฐํ๋ค๋ฉด ์ฌ์ค์ ๋ถํฉ๊ฒฉ
์ด๋ผ๋ ์๊ธฐ๋ค.
์ด๋ ๊ฒ Linear
์ ์ฌ์ฉํ ๊ฒฝ์ฐ ์ฐธ ์ต์ธํ ์ํฉ์ด ์ฐ์ถ๋๊ฒ ๋๋ค..o(TใTo) (์ด๋ ์ ๋๋ก ๋ ํ์ต์ด๋ผ ๋ณผ ์ ์๋ค)
๋ฐ์ดํฐ์ ๋ฐ์๋ํ ๋ฌธ์ ์ง๋ง ๋ ๋ค๋ฅธ ๋ฌธ์ ์ ์ด ์๋ค.
์ ํ ํจ์๋ผ๋ ๊ฒ์ y์ถ์ ์๊ณผ ์์ ๋ฐฉํฅ์ผ๋ก ์ฌ์ค์ ๋ฌดํํ๊ฒ ์ด์ด์ ธ ์๋ค๋ ์ ์ด๋ค. (์ ํ์ด ์๋ค)
y = 1x ๋ผ๋ ํจ์๊ฐ ์๋ค๋ฉด, x์ 100์ ๋ฃ์ผ๋ฉด, y๋ 100์ด๋๊ณ , 1000์ ๋ฃ์ผ๋ฉด 1000๊น์ง... y์ ๋ฒ์๊ฐ ๋ฌด๊ถ๋ฌด์งํ๋ค.
๊ทธ๋์ ์ด๊ฒ ๋ฌด์จ ๋ฌธ์ ์ธ๊ฐ?
y๋ 0๋๋ 1๋ง์ ๊ฐ์ ธ์ผํ๋ ์ด์ง๋ถ๋ฅ
์์ ์์ ๋ฌดํ๋, ์์ ๋ฌดํ๋๋ก ์ถ๋ ฅ๊ฐ์ด ๋์ฌ ์ ์๋ค๋ ๊ฒ์ ์ถ๋ ฅ์ ๋ฒ์๊ฐ ๋๋ฌด๋ ๊ด๋ฒ์ ํด์ง๋ค๋ ๊ฒ์ด๊ณ threshold
์ฆ, ์ด๋๋ฅผ ๊ธฐ์ค์ผ๋ก ์ด์, ๋ถ์ด์๋ก ํด์ผํ๋์ง ์๊ณ๊ฐ
์ ์ง์ ํ๋ ๊ฒ ๋ํ ๋๋ฌด๋ ์ด๋ ต๊ฒ ๋๋ค.
๋ฐ๋ผ์ Logistic Function(Sigmoid Function)์ ์ฌ์ฉํ๋ ๊ฒ์ด๋ค!
- ํจ์ ๋ฐ ๊ทธ๋ํ์ ๊ฐํ
- (๊ฒฐ๊ณผ ๊ฐ ๊ฐ 0 ๊ณผ 1 ์ฌ์ด์ ๊ฐ์ ๊ฐ์ง๋ค.)
- ์์ (์ ํํ๊ท ์์ ๋ฅผ ๊ทธ๋๋ก ๋ถ์์ ์์ฐ์์()์ ์ง์ ๊ฐ์ผ๋ก ์ฌ์ฉํ๋ค.)
์ด๋ฅผ ํตํด ์ถ๋ ฅ(์์ธก๊ฐ)์ด 0<< 1์ฌ์ด์ ์์นํ๋๋ก ์ฌ์ฉํ ์ ์๋ค!๐ ์ฐธ๊ณ
- ์ด๋ฌํ
Logistic Regression
์ ()๋ก ๋ค์ด๊ฐ๋ ์ ํํ๊ท ์์์Affine Function
์ด๋ผ๊ณ ํ๋ค.
Weight์ Bias์ ๋ฐ๋ฅธ ๊ฐํ์ ์ดํด๋ณด๋กํ์. ์์์ ๋ค์๊ณผ ๊ฐ๋ค.
์์์์ ์ฆ, ๋ฅผ ํ์ด์ ์ผ๋ค.
w๊ฐ ์์์ง์๋ก ์ ์ ๊ฐ๋๊ฐ ๋ฎ์์ ธ ๋์จํ ํํ์ sigmoidํจ์๊ฐ ๋๋ฉฐ, ์ค์ฐจ๊ฐ ์ฆ๊ฐํ๊ฒ ๋๋ค.
๋ฐ๋๋ก w๊ฐ ์ปค์ง์๋ก ์ค์ฐจ๋ ๊ฐ์ํ๊ฒ ๋๋ค.
b๋ ๊ฐ์ด ๋๋ฌด ์ปค์ง๊ฑฐ๋, ๋๋ฌด ์์์ง๋ ๊ฒฝ์ฐ ์ค์ฐจ๊ฐ ์ฆ๊ฐํ๊ฒ ๋๋ค.
๊ธฐ์กด์ ๊ณต๋ถํ๋ Cost function์ ํ๊ท ์ ๊ณฑ์ค์ฐจ
๋ฅผ ์ฌ์ฉํ๋ค.
- ํ๊ท ์ ๊ณฑ ์ค์ฐจ
์ด ์์ Linearํ ์ฆ, ์ผ์ฐจ๋ฐฉ์ ์ ๋ํด์ ์ ์ฉํ๋ค๋ฉด ๋ค์๊ณผ ๊ฐ์ ์ค์ฐจ๋ฅผ ๋ํ๋ด๋ Cost Function์ด ๊ทธ๋ ค์ง๋ค.
- ์ผ์ฐจ๋ฐฉ์ ์(์ง์ )์ ๋ํ ํ๊ท ์ ๊ณฑ์ค์ฐจ์ ๊ทธ๋ํ
์ด ๋ถ๋ถ์ด ์ ์ดํด๊ฐ ๋์ง ์๋๋ค๋ฉด ๋ค์ part06 - ๊ฒฝ์ฌํ๊ฐ๋ฒ(Linear ์์ )๋ฅผ ์ฝ์ด๋ณด๋ฉด ๋๋ค.
ํ์ง๋ง, ์ด๋ฅผ Linearํ์ง์์, Sigmoidํจ์๊ฐ ๋ก ํ๊ท ์ ๊ณฑ์ค์ฐจ(MSE)์ ์์ ๋ค์ด๊ฐ๊ฒ๋๋ฉด Cost Function์ ์ด๋ป๊ฒ ๋์ฌ๊น?
์ด๋ฌํ ๊ทธ๋ํ๊ฐ ๋์จ๋ค!
- Sigmoid์ ๋ํ ํ๊ท ์ ๊ณฑ์ค์ฐจ์ ๊ทธ๋ํ(์์)
ํ์ง๋ง, ์ด๋ ๊ฒฝ์ฌํ๊ฐ๋ฒ์ ์ํํ๋ค๋ณด๋ฉด ์ค์ฐจ์ ์์ํ๋ ์์น์ ๋ฐ๋ผ์ ์ ๊ทธ๋ฆผ๊ณผ ๊ฐ์ด ์ง์ญ์ต์ํด
์ ๋น ์ง ์ ์๋ค.
์ง์ญ์ต์ํด
: ์ค์ ์ต์ ์ค์ฐจ
๋ ์ ~์๋ ์์ง๋ง, ๋ค๋ฅธ ๊ตด๊ณก์ ๋ ๋ถ๋ถ์์ต์ ์ค์ฐจ
๋ผ๊ณ ์๊ฐํ๊ฒ ๋๋ ๊ฒ.
๋ฐ๋ผ์, ์ฐ๋ฆฌ๋ Sigmoid๋ฅผ ์ ๋ฐ์ํ ์ ์๋ ์๋ก์ด ์ค์ฐจ ํจ์๋ฅผ ๋ง๋ค์ด์ผํ๋ค.
MSE์ผ ์๊ฐ! ๐
์๋ก์ด ์ค์ฐจ ํจ์๋ฅผ ๋ง๋ค๊ธฐ ์ํด์ ์๊ทธ๋ชจ์ด๋ ํจ์๋ฅผ ๋ค์ ์ดํด๋ณด์.
์๊ทธ๋ชจ์ด๋ ํจ์์ ํน์ง์ y๊ฐ์ด 0๊ณผ 1์ฌ์ด๋ผ๋ ์ ์ด๋ค.
์ฆ, ์ค์ ๊ฐ(๊ฒฐ๊ณผ)์ด 1(true)์ผ ๋, 0(false)์ ๊ฐ๊น์ ์ง์๋ก ์ค์ฐจ๊ฐ ์ฆ๊ฐํ ๊ฒ์ด๊ณ ,
๋ฐ๋๋ก ์ค์ ๊ฐ(๊ฒฐ๊ณผ)์ด 0(false)์ผ ๋, 1(true)์ ๊ฐ๊น์ ์ง์๋ก ์ค์ฐจ๊ฐ ์ฆ๊ฐํ ๊ฒ์ด๋ค.
์ด ํน์ง์ ์ ํํํ ์ ์๋ ๋ฐฉ๋ฒ์ด ๋ฌด์์ผ๊น?
๋ฐ๋ก ๋ก๊ทธํจ์!
๋ก๊ทธํจ์๋ก Cost function(๋น์ฉ ํจ์)๋ฅผ ๋ํ๋ด๋ฉด ๋ค์๊ณผ ๊ฐ๋ค.
์ฐธ
์ผ๋์ ๊ฑฐ์ง
์ผ ๋๋ฅผ ๋ฐ๋ก ๋ถ๋ฆฌํด์ ๊ทธ๋ ค์ง๋ค.
- Convex logistic regression cost function
- ์ค์ ๋ฐ์ดํฐ์ ๊ฐ์ด ์ฐธ(1)์ธ ๊ฒฝ์ฐ (์ข) : ๊ฑฐ์ง(0)์ ๊ฐ์ ์ ๊ฐ์ด ๊ฐ๊น์์ง์๋ก ์ค์ฐจ(y)์ ๊ฐ์ ์ฆ๊ฐํ๋ค. (๋ฐ๋๋ก ์ฐธ(1)์ ๊ฐ๊น์์ง๋ฉด ์ค์ฐจ๊ฐ ๊ฐ์)
- ์ค์ ๋ฐ์ดํฐ์ ๊ฐ์ด ๊ฑฐ์ง(0)์ธ ๊ฒฝ์ฐ (์ฐ) : ์ฐธ(1)์ ๊ฐ์ ์ ๊ฐ์ด ๊ฐ๊น์์ง์๋ก ์ค์ฐจ(y)์ ๊ฐ์ ์ฆ๊ฐํ๋ค. (๋ฐ๋๋ก ๊ฑฐ์ง(0)์ ๊ฐ๊น์์ง๋ฉด ์ค์ฐจ๊ฐ ๊ฐ์)
์ด๋ค๊ฐ? ๋ก๊ทธ๋ก ํํํ๋ ์๊น ๋งํ๋ sigmoid์ ํน์ง์ ์ ๋ฐ์ํ์ง ์์๋๊ฐ?
- ๋ฐฉ๊ธ๋ดค๋ ํน์ง
์ฐธ, ๊ฑฐ์ง ๋๊ฐ๋ก ๋ถ๋ฆฌํด์ Cost function์ ์ฌ์ฉํ๊ธฐ์๋ ์ฌ๊ฐ ๋ถํธํ ์ผ์ด ์๋๋ค.
๋ฐ๋ผ์ ํด๋น ํจ์ 2๊ฐ๋ฅผ ์ฐธ/๊ฑฐ์ง ๋ ๋ค ๋ฐ์ํ ์ ์๋๋ก ํฉ์ณ๋ณด๋๋ก ํ์.
ํฉ์น๋ฉด ๋ค์๊ณผ ๊ฐ์ด ๋๋ค.
์ด๋ ๊ฒ ํฉ์ณ์ง cost function์ Binary Cross Entrop ๋ผ๊ณ ๋ถ๋ฅธ๋ค.
์๋ก์ด cost function(Binary Cross Entrop)์ ์ป์์ผ๋ ์ด์ , Gradient Dscent๊ณผ์ ์ ์ํํด์ ์ต์์ ์ค์ฐจ๋ฅผ ๊ตฌํด๋ณด์!
Gradient Descent๋ฅผ ์ด๋ป๊ฒ ์ํ ํ๋๊ฐ?
๋ฐ๋ก ํ์ธํด๋ณด๋๋ก ํ์.
- cost function์ ํ์ฌ()๋ฅผ ๊ธฐ์ค์ผ๋ก ๊ฐ๊ฐ ํธ๋ฏธ๋ถ
- ๋ฏธ๋ถ์ ํตํด ์ป์ (๊ธฐ์ธ๊ธฐ ๊ฐ x
lr
)๋ฅผ ๊ธฐ์กด ์์ ๋นผ์ค๋ค.
๊ฒฝ์ฌํ๊ฐ๋ฒ์ด๋ฏ๋ก, ์์ด์กฐ๊ธ๋ณต์กํด์ก์ ๋ฟ. ๊ธฐ์กด Linear์ ๊ฒฝ์ฌํ๊ฐ๋ฒ์ ํ๋ ๋ฐฉ์์ด ๋์ผํ๋ค.
๋ง์ง๋ง์ผ๋ก ๋ก์ง์คํฑ ํ๊ท๋ถ์์ ๊ณผ์ ์ ์ต์ข ์ ์ผ๋ก ์ ๋ฆฌํด๋ณด๊ณ ๋๋ด๋๋ก ํ์.
1. ์ ํ ํ๊ท์์ ์ ์๋๋ ์ผ์ฐจ๋ฐฉ์ ์์
Affine function
์ผ๋ก ํ์ฉ
2.Logistic function
์ ์ ์ (sigmoid ํจ์์ ๊ฐ์ Affine function ๋ฅผ ๋ฃ์)
3. ๋ก์ง์คํฑ ํ๊ท๋ถ์์ ๋ง๋Cost Function
์ธ Cross Entropy Loss(BCE)๋ฅผ ์ ์
4. BCE๋ฅผ ํธ๋ฏธ๋ถ( ๊ฐ๊ฐ)ํ ๊ฐ์ ์ ์ ํlr
๋ฅผ ๊ณฑํด ๋นผ์ค์ผ๋ก ์จ, Gradient Desent๋ฅผ ์ํํ๋ค.
๊ณ ์ํ๋ค! ๋ด๊ฐ!