๐ป ๋ฅ๋ฌ๋์ ๊น์ด ์๋ ์ดํด๋ฅผ ์ํ ๋จธ์ ๋ฌ๋ ๊ฐ์ 1-2
๐ Discriminative vs. Generative model
๐ Generative model๊ณผ Discriminate model ์ฐจ์ด์ ๊ณผ ๋น๊ต
๐ discriminative vs generative
์ด๋ฒ ํฌ์คํ ์์ ์ ๋ฆฌํ ๊ฐ๋ ์ ์ฒซ ๋ฒ์งธ ๊ฐ์์ 1-2 part์ ์๋ ์ธ ๊ฐ์ง ๋ธ๋ก๊ทธ๋ฅผ ์ฐธ๊ณ ํ์ฌ ์ ๋ฆฌํ์์ ๋ฐํ๋๋ค.
๋ํ, ํด๋น ํฌ์คํ ์ ์ฌ์ฉ๋ ์ด๋ฏธ์ง๋ ์ฒซ ๋ฒ์งธ reference์ ๊ฐ์ ์๋ฃ(pdf)์์ ๋ฐํ๋๋ค.
Pattern Recognition์์ classification์ ์ฌ์ฉํ๋ ๋ชจ๋ธ์ 2๊ฐ์ง๋ก ๋๋ฉ๋๋ค.
Generative model๊ณผ Discriminate model์ธ๋ฐ์.
์ด ๋ ๊ฐ์ง๋ฅผ ๊ฐ๊ฐ ์ดํด๋ณด๊ฒ ์ต๋๋ค.
๊ตฌ๊ธ์ Background: What is a Generative Model? ์ ๊ธ์ ์ดํด๋ณด๋ฉด, ๋ ๊ฐ์ง ๋ชจ๋ธ์ ๋ํ ์ ์๊ฐ ๋์ ์์ต๋๋ค.
์๋ก์ด ๋ฐ์ดํฐ ์ธ์คํด์ค๋ฅผ ์์ฑํ ์ ์๋ค๋ ์ ๊ณผ ์๋ก ๋ค๋ฅธ ์ข ๋ฅ์ ๋ฐ์ดํฐ ์ธ์คํด์ค๋ฅผ ๊ตฌ๋ณ ํ ์ ์๋ค๋ ์ ์ด ์ฐจ์ด์ ์ ๋๋ค.
generative model์ด๋ sample์ ํ๋ฅ ์ ์ผ๋ก ํํํ์ฌ ์ผ๋ฐํํ ๋ชจ๋ธ์ ์๋ฏธํฉ๋๋ค.
๋ฐ์ดํฐ ๊ฐ ์์ฑ๋๋ ๊ณผ์ ์ ๋ ๊ฐ์ ํ๋ฅ ๋ชจํ
์ผ๋ก ์ ์ํ ์ ์์ผ๋ฉฐ
bayes rule์ ์ฌ์ฉํด ๋ฅผ ๊ฐ์ ์ ์ผ๋ก ๋์ถํ๋ ๋ชจ๋ธ์ ๊ฐ๋ฆฌํต๋๋ค.
๋ ์ฝ๊ฒ ๋ง๋ก ์ค๋ช ํ๋ฉด, ์ฃผ์ด์ง training data๋ฅผ ํ์ตํ์ฌ ํ์ต ๋ฐ์ดํฐ์ ๋ถํฌ๋ฅผ ๋ฐ๋ฅด๋ ์ ์ฌํ ๋ฐ์ดํฐ๋ฅผ ์์ฑํ๋ ๋ชจ๋ธ์ ์๋ฏธํฉ๋๋ค.
ํ์ต ๋ฐ์ดํฐ์ ์ ์ฌํ sample์ ์ฐพ๋ ๊ฒ์ด ๋ชฉํ์ด๊ธฐ ๋๋ฌธ์ ํ์ต ๋ฐ์ดํฐ์ ๋ถํฌ๋ฅผ ํ์ ํ์ฌ ํ์ตํ๋ ๊ฒ์ด ๊ฐ์ฅ ์ค์ํ ๋ชฉ์ ์ด ๋ฉ๋๋ค.
generative model์ ๋ฌธ์ ์ ์ ๊ธฐ์กด์ ์ฌ์ฉ๋ sample๋ค๊ณผ์ ๊ฑฐ๋ฆฌ ๊ฐ์ ๊ธฐ์ค์ผ๋ก ๋ถ๋ฅํ๋ฏ๋ก ์๋ก์ด feature๊ฐ ์ ๋ ฅ๋๋ฉด ๊ฒฐ๊ณผ๊ฐ์ด ๋์ค์ง ์๋๋ค๋ ๊ฒ์ ๋๋ค.
๊ทธ๋์ 0๊ณผ 1์ฒ๋ผ ๋ช ํํ ๊ฒฐ๋ก ์ ๋์ถํ๊ธฐ์ ์ ํฉํ์ง ์์ ๋ชจ๋ธ์ด๋ผ ๋ณผ ์ ์์ต๋๋ค.
generative model์ parametric model๊ณผ non-parametric model๋ก ๋ทด๋ฅํ ์ ์๋๋ฐ์.
parametric model์ ์ด๋ค ๊ฑฐ๋ฆฌ ๊ฐ์ ๊ธฐ๋ฐ์ผ๋ก ๊ฐ์ ๋์ถํ๋ฉฐ
non-parametric model์ ๊ฑฐ์ ๋ชจ๋ ์ํ๋ค์ ํ์ฉํ๋ ๋ชจ๋ธ์ ์๋ฏธํฉ๋๋ค.
generative model์ class์ distribution์ ์ฃผ๋ชฉํ์ฌ ํ์ตํ๋ ๊ฒ์ด ๋ชฉํ์ด๊ธฐ ๋๋ฌธ์
์ผ๋ฐ์ ์ธ bayesian inference๊ณผ ๋ง์ฐฌ๊ฐ์ง๋ก training data๊ฐ ๋ง์ ์๋ก discriminative model๊ณผ ๋น์ทํ ์ฑ๋ฅ์ผ๋ก ์๋ ดํ๋ ๊ฒฝํฅ์ด ์์ต๋๋ค.
discriminative model์ด๋ ์ผ๋ฐ์ ์ด๊ณ ์ง๊ด์ ์ธ ๋จธ์ ๋ฌ๋ ๋ชจ๋ธ์ด๋ผ ์๊ฐํ์๋ฉด ๋ฉ๋๋ค.
๋ฐ์ดํฐ ๊ฐ ์ฃผ์ด์ก์ ๋ ๋ ์ด๋ธ ๊ฐ ๋ํ๋ ์กฐ๊ฑด๋ถํ๋ฅ ๋ฅผ ์ง์ ์ ์ผ๋ก ๋ฐํํ๋ ๋ชจ๋ธ์ ๊ฐ๋ฆฌํค๋๋ฐ์.
lable ์ ๋ณด๊ฐ ์์ด์ผ ํด์ ์ง๋ํ์ต์ ์ํ๋ฉฐ, ์ lable์ ์ ๊ตฌ๋ถํ๋ decision boundary๋ฅผ ํ์ตํ๋ ๊ฒ์ด ๋ชฉํ๊ฐ ๋ฉ๋๋ค.
๋ํ์ ์ธ ์์๋ก linear regression๊ณผ logistic regression์ด ์์ต๋๋ค.
์ด๋ฏธ์ง๋ฅผ ์ฐธ๊ณ ํ์ฌ ๋ค์ ์ค๋ช ํ๊ฒ ์ต๋๋ค.
discriminative model๋ ํ์ต์ ์กด์ฌํ๋ data๋ฅผ ํ์ฉํด decision boundary๋ฅผ ๋์ถํฉ๋๋ค.
๋ ๊ฐ์ง ์ข ๋ฅ์ sample์ด ์กด์ฌํ ๋ ๋ ๊ฐ์ง sample์ ๋ถ๋ฅํ ์ ์๋ ์ ์ ์ฐพ๋ ๊ฒ์ ๋๋ค.
๋จ์ํ ๋ ๊ฐ์ ์ ํํ ์ ์ผ๋ก ๊ตฌ๋ถํ ์ ์๋ ์ ์ ์ฐพ์๋๊ฐ๋ ๊ณผ์
discriminative model์ ์ฅ์ ๊ณผ ๋จ์ ์
discriminative model์ ๋ช ๊ฐ์ง ํน์ง์ ์ธ pattern์ ์ฐพ์ ์ฐจ์ด๋ฅผ ํ์ตํฉ๋๋ค.
๊ทธ ์์๋ก least square์ support vector machine์ด ์๋๋ฐ์.
least square์ ๊ฒฝ์ฐ ๋ชจ๋ sample๋ค ๊ฐ์ ๊ฑฐ๋ฆฌ๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ๊ฐ์ด๋ฐ ์ ์ ์ฐพ๋ ๊ณผ์ ์ ๋๋ค.
sample๋ค ๊ฐ์ ๊ฑฐ๋ฆฌ๋ฅผ ์ต์ํํ๋ ์ ์ ์ฐพ์ง๋ง, ์๋ชป๋ sample์ด ์กด์ฌํ ๊ฒฝ์ฐ ๊ฒฐ๊ณผ์ ์๋ชป๋ ์ํฅ์ ๋ฏธ์น๊ฒ ๋ฉ๋๋ค.
์ด๋ฐ ํน์ดํ sample์ ์ ๊ฑฐํ๊ฑฐ๋ ๋ฌด์ํ์ฌ decision boundary๋ฅผ ์ฐพ๋ ๋ฐฉ๋ฒ๋ ์์ต๋๋ค.
support vector machine์ ๊ฐ์ฅ ๊ฐ๊น์ด ์๋ sample 2๊ฐ๋ฅผ ์ง์ด์ ๊ทธ ๋ ๊ฐ์ ๊ฐ์ด๋ฐ๋ฅผ ๊ฐ๋ก์ง๋ฅด๋ decision boundary๋ฅผ ๋์ถํฉ๋๋ค.
์ด๋ฅผ maximum margin์ด๋ผ๊ณ ํ๋ค๋ค์.
์๋์ ์ผ๋ก ์ ํํ ๊ฒฐ๊ณผ ๊ฐ์ ์ป์ ์ ์๋ค๊ณ ํฉ๋๋ค.
์ ๊ทธ๋ฆผ์ ์์ผ๋ก ์ด ์ซ์์ generative and discriminative model์ ๋๋ค.
์ผ์ชฝ์ discriminative model์ ์๊ธ์จ๊ฐ 0์ธ์ง 1์ธ์ง ์ฐจ์ด๋ฅผ ๋งํ๋ ค๊ณ ํ๋ฉฐ,
line์ ํตํด ๋ฐ์ดํฐ๊ฐ ์ด๋์ ๋ฐฐ์น๋๋์ง ๋ชจ๋ธ๋ง ํ ํ์์์ด 0๊ณผ 1์ ๊ตฌ๋ณํ ์ ์์ต๋๋ค.
generative model์ ๊ฒฝ์ฐ, ๋ฐ์ดํฐ ๊ณต๊ฐ์์ ์ค์ ์ ๊ฐ๊น์ด ์ซ์๋ฅผ ์์ฑํด์ 1๊ณผ 0์ ์์ฑํ๋ ค๊ณ ํฉ๋๋ค.
๋ฐ๋ผ์ ๋ฐ์ดํฐ ๊ณต๊ฐ ์ ์ฒด์ ๋ถํฌ๋ฅผ ๋ชจ๋ธ๋งํ๋ ๊ณผ์ ์ด ํ์ํฉ๋๋ค.
๋ model์ ๋น๊ตํ๋ ์ด๋ฏธ์ง๋ ๋ ๋ง์ต๋๋ค.
generative model์ posterior๋ฅผ ๊ฐ์ ์ ์ผ๋ก, discriminative model์ ์ง์ ์ ์ผ๋ก ๋์ถํฉ๋๋ค.
generative model์ ๋ฐ์ดํฐ ๋ฒ์ฃผ์ ๋ถํฌ๋ฅผ ํ์ตํ๋ฉฐ, discriminative model์ decision boundary๋ฅผ ํ์ตํฉ๋๋ค.