๐ป ๋ฅ๋ฌ๋์ ๊น์ด ์๋ ์ดํด๋ฅผ ์ํ ๋จธ์ ๋ฌ๋ ๊ฐ์ 4-1
๐ Parametric model๊ณผ Non-parametric model
๐ Parametric vs Nonparametric Models
์ด๋ฒ ํฌ์คํ ์์ ์ ๋ฆฌํ ๊ฐ๋ ์ ์ฒซ ๋ฒ์งธ ๊ฐ์์ 4-1 part์ ์๋ ์ธ ๊ฐ์ง ๋ธ๋ก๊ทธ๋ฅผ ์ฐธ๊ณ ํ์ฌ ์ ๋ฆฌํ์์ ๋ฐํ๋๋ค.
๋ํ, ํด๋น ํฌ์คํ ์ ์ฌ์ฉ๋ ์ด๋ฏธ์ง๋ ์ฒซ ๋ฒ์งธ reference์ ๊ฐ์ ์๋ฃ(pdf)์์ ๋ฐํ๋๋ค.
Parametric ๊ณผ Non-parametric์ ๊ฐ๋ ์ ํต๊ณํ์์ parameter(๋ชจ์)๋ฅผ ํ์๋ก ํ๋๊ฐ, ํ์๋ก ํ์ง ์๋ ๊ฐ์ ๋ฐ๋ผ ๋ชจ์ํต๊ณํ(Parametric Statistics)์ ๋น๋ชจ์ํต๊ณํ(Nonparametric Statistics)๋ก ๊ตฌ๋ถํฉ๋๋ค.
๋จธ์ ๋ฌ๋์ ๊ณต๋ถํ๋ค๊ฐ Parametric model๊ณผ Non-parametric model์ ์ข ์ข ๋ค์ด๋ณด์ จ์ ๊ฒ ๊ฐ์๋ฐ์.
์ด ๋ ๊ฐ๋ ์ ๋ค์์ ๋ ์์ฒญ ๋ฏ์ค๊ฒ ๋๊ปด์ง๋๋ฐ, ์๊ฐ๋ณด๋ค ๊ฐ๋จํฉ๋๋ค.
๊ทธ์ ์ model parameter์ model hyper parameter์ ๋ํ ๊ฐ๋ ์ ์๊ณ ๊ณ์ ์ผ ์ดํด์ ๋์์ด ๋ฉ๋๋ค.
parametric๊ณผ Non-parametric model ์ฌ์ด์ ์ ํ์ ํ์ํ paramter ์์ ๋ฐ๋ผ ๋ค๋ฆ ๋๋ค.
๋ด๋ ค์ง ์ ์์ ๋ฐ๋ฅด๋ฉด,
- Parametric model has a fixed number of parameters.
- Non-parametric model has the number of parameters growing with the amount of training data.
๋ผ๊ณ ํฉ๋๋ค.
ํ๋์ฉ ์ดํด๋ณด๊ฒ ์ต๋๋ค.
model parameter๋ model ๋ด๋ถ์ ์๊ณ ๋ฐ์ดํฐ์์ ๊ฐ์ ์ถ์ ํ ์ ์๋ ๊ตฌ์ฑ ๋ณ์์ ๋๋ค.
parameter๋ machine learing algorithms์ ํต์ฌ์ ๋๋ค.
๊ณผ๊ฑฐ ํ๋ จ ๋ฐ์ดํฐ์์ ํ์ต๋ ๋ชจ๋ธ์ ์ผ๋ถ์ ๋๋ค.
ํต๊ณ์ ๊ด์ ์์๋
๊ฐ์ฐ์ค ๋ถํฌ์ ๊ฐ์ ๋ณ์์ ๋ํ ๋ถํฌ๋ฅผ ๊ฐ์ ํ ์ ์์ต๋๋ค.
๊ฐ์ฐ์ค ๋ถํฌ์ ๋ parameter๋ ํ๊ท ()๊ณผ ํ์คํธ์ฐจ()์ด๊ณ , ์ด๋ฌํ paramter๊ฐ data์์ ์ถ์ ๋๊ณ ์์ธก ๋ชจ๋ธ์ ์ผ๋ถ๋ก ์ฌ์ฉ๋ ์ ์๋ machine learning์์๋ ์ ์ฉ๋ฉ๋๋ค.
ํ๋ก๊ทธ๋๋ฐ ๊ด์ ์์
paramter๋ฅผ ํจ์์ ์ ๋ฌํ ์ ์์ต๋๋ค. ์ด ๊ฒฝ์ฐ์ paramter๋ ๊ฐ ๋ฒ์์ค ํ๋๋ฅผ ๊ฐ์ง ์ ์๋ ์ธ์ ์ค ํ๋์ ๋๋ค.
ML์์ ์ฌ์ฉ ์ค์ธ ํน์ model์ function์ด๋ฉฐ data์ ๋ํ prediction์ ์ํํ๊ธฐ ์ํด paramter๊ฐ ํ์ํฉ๋๋ค.
์ด๋ ๋ชจ๋ธ์ ๊ณ ์ ๋๋ ๊ฐ๋ณ parameter ์๊ฐ ์๋์ง์ ์ฌ๋ถ๊ฐ โparametricโ or โnonparametricโ์ ๊ฒฐ์ ํฉ๋๋ค.
parametric model์ ๋ฐ์ดํฐ๊ฐ ํน์ ๋ถํฌ๋ฅผ ๋ฐ๋ฅธ๋ค๊ณ ๊ฐ์ ํ๊ณ , ํ์ต์ ํ๋ฉด์ ๊ฒฐ์ ํด์ผ ํ๋ ๋ถํฌ์ parameter ์ข ๋ฅ์ ์๊ฐ ๋ช ํํ๊ฒ ์ ํด์ ธ ์์ต๋๋ค.
๋ฐ์ดํฐ์ ์์ ๋ฐ๋ผ paramter์ ์๊ฐ ๋ณํ์ง ์์ต๋๋ค.
๋ฐ๋ผ์ parametric model์ model์ ํํ๋ฅผ ์ ํ๊ณ , ์ด model์ paramter๋ฅผ ํ์ต์ ํตํด ๋ฐ์ ์ํค๋ ์๊ณ ๋ฆฌ์ฆ์ ๋๋ค.
non-parametric model์ ๋ฐ์ดํฐ๊ฐ ํน์ ๋ถํฌ๋ฅผ ๋ฐ๋ฅธ๋ค๋ ๊ฐ์ ์ด ์๊ธฐ ๋๋ฌธ์ ํ์ต์ ๋ฐ๋ผ tuningํด์ผ ํ paramter๊ฐ ๋ช ํํ ์ ํด์ ธ ์์ง ์์ต๋๋ค.
๋ฐ๋ผ์ non-parametric model์ data์ ๋ํ ์ฌ์ ์ง์์ด ์ ํ ์์ ๋ ์ ์ฉํ๊ฒ ์ฌ์ฉ๋ฉ๋๋ค.
parametric model
Nonparametric Models
parametric model | non-parametric model | |
---|---|---|
์ ์ | ํ๋ผ๋ฏธํฐ์ ๊ฐ์๊ฐ ๊ณ ์ ๋ ๋ชจ๋ธ | ๋ฐ์ดํฐ ์ํ๊ณผ ๊ฑฐ์ ๋์ผํ๊ฑฐ๋ ๋น๋กํ๋ ๋ชจ๋ธ |
์ข ๋ฅ | linear regression, logistic regression, bayes inference, neural network(cnn, rnn ๋ฑ) | decison tree, random forest, K-NN classifier |
ํน์ง | ๋ฐ์ดํฐ๊ฐ ๋ง์์๋ก ์ ํ๋๊ฐ ์ฌ๋ผ๊ฐ | ๋ฐ์ดํฐ๊ฐ ํน์ ๋ถํฌ๋ฅผ ๋ฐ๋ฅธ๋ค๋ ๊ฐ์ ์ ํ์ง ์์ ๋ flexibleํจ |
ํ๊ณ | ๊ณ ์ ๋ paramter๋ก๋ ๋ ํฐ ๋ฐ์ดํฐ๋ฅผ ์ฒ๋ฆฌํ ์ ์์ | ์๋๊ฐ ๋๋ฆฌ๊ณ , ๋ง์ ๋ฐ์ดํฐ๋ฅผ ํ์๋ก ํ์ง ์์, ๋ชจ๋ธ์ ํํ์ ๋ํ ๋ช ํํ ์ค๋ช ์ด ์ด๋ ค์ |