[DL] Parametric vs Non-parametric model

๋ฏธ๋‚จ์ž‰ยท2022๋…„ 3์›” 9์ผ
0

Reference

๐Ÿ’ป ๋”ฅ๋Ÿฌ๋‹์˜ ๊นŠ์ด ์žˆ๋Š” ์ดํ•ด๋ฅผ ์œ„ํ•œ ๋จธ์‹ ๋Ÿฌ๋‹ ๊ฐ•์˜ 4-1
๐Ÿ”— Parametric model๊ณผ Non-parametric model
๐Ÿ”— Parametric vs Nonparametric Models

์ด๋ฒˆ ํฌ์ŠคํŒ…์—์„œ ์ •๋ฆฌํ•  ๊ฐœ๋…์€ ์ฒซ ๋ฒˆ์งธ ๊ฐ•์˜์˜ 4-1 part์™€ ์•„๋ž˜ ์„ธ ๊ฐ€์ง€ ๋ธ”๋กœ๊ทธ๋ฅผ ์ฐธ๊ณ ํ•˜์—ฌ ์ •๋ฆฌํ–ˆ์Œ์„ ๋ฐํž™๋‹ˆ๋‹ค.

๋˜ํ•œ, ํ•ด๋‹น ํฌ์ŠคํŒ…์— ์‚ฌ์šฉ๋œ ์ด๋ฏธ์ง€๋Š” ์ฒซ ๋ฒˆ์งธ reference์˜ ๊ฐ•์˜ ์ž๋ฃŒ(pdf)์ž„์„ ๋ฐํž™๋‹ˆ๋‹ค.


Parametric ๊ณผ Non-parametric์˜ ๊ฐœ๋…์€ ํ†ต๊ณ„ํ•™์—์„œ parameter(๋ชจ์ˆ˜)๋ฅผ ํ•„์š”๋กœ ํ•˜๋Š”๊ฐ€, ํ•„์š”๋กœ ํ•˜์ง€ ์•Š๋Š” ๊ฐ€์— ๋”ฐ๋ผ ๋ชจ์ˆ˜ํ†ต๊ณ„ํ•™(Parametric Statistics)์™€ ๋น„๋ชจ์ˆ˜ํ†ต๊ณ„ํ•™(Nonparametric Statistics)๋กœ ๊ตฌ๋ถ„ํ•ฉ๋‹ˆ๋‹ค.

๋จธ์‹ ๋Ÿฌ๋‹์„ ๊ณต๋ถ€ํ•˜๋‹ค๊ฐ€ Parametric model๊ณผ Non-parametric model์„ ์ข…์ข… ๋“ค์–ด๋ณด์…จ์„ ๊ฒƒ ๊ฐ™์€๋ฐ์š”.

์ด ๋‘ ๊ฐœ๋…์„ ๋“ค์—ˆ์„ ๋• ์—„์ฒญ ๋‚ฏ์„ค๊ฒŒ ๋Š๊ปด์ง€๋Š”๋ฐ, ์ƒ๊ฐ๋ณด๋‹ค ๊ฐ„๋‹จํ•ฉ๋‹ˆ๋‹ค.

๊ทธ์ „์— model parameter์™€ model hyper parameter์— ๋Œ€ํ•œ ๊ฐœ๋…์„ ์•Œ๊ณ  ๊ณ„์…”์•ผ ์ดํ•ด์— ๋„์›€์ด ๋ฉ๋‹ˆ๋‹ค.

parametric๊ณผ Non-parametric model ์‚ฌ์ด์˜ ์„ ํƒ์€ ํ•„์š”ํ•œ paramter ์ˆ˜์— ๋”ฐ๋ผ ๋‹ค๋ฆ…๋‹ˆ๋‹ค.

๋‚ด๋ ค์ง„ ์ •์˜์— ๋”ฐ๋ฅด๋ฉด,

  • Parametric model has a fixed number of parameters.
  • Non-parametric model has the number of parameters growing with the amount of training data.

๋ผ๊ณ  ํ•ฉ๋‹ˆ๋‹ค.

ํ•˜๋‚˜์”ฉ ์‚ดํŽด๋ณด๊ฒ ์Šต๋‹ˆ๋‹ค.

What is a model parameter?

model parameter๋Š” model ๋‚ด๋ถ€์— ์žˆ๊ณ  ๋ฐ์ดํ„ฐ์—์„œ ๊ฐ’์„ ์ถ”์ •ํ•  ์ˆ˜ ์žˆ๋Š” ๊ตฌ์„ฑ ๋ณ€์ˆ˜์ž…๋‹ˆ๋‹ค.

  • ์˜ˆ์ธกํ•  ๋•Œ ๋ชจ๋ธ์— ํ•„์š”
  • ๋ฌธ์ œ์— ๋Œ€ํ•œ ๋ชจ๋ธ์„ ์ •์˜
  • ๋ฐ์ดํ„ฐ์—์„œ ์ถ”์ •๋˜๊ฑฐ๋‚˜ ํ•™์Šต๋จ
  • ์ˆ˜๋™์œผ๋กœ ์„ค์ •ํ•˜์ง€ ์•Š์Œ
  • ์ข…์ข… ํ•™์Šต๋œ ๋ชจ๋ธ์˜ ์ผ๋ถ€๋กœ ์ €์žฅ๋จ

parameter๋Š” machine learing algorithms์˜ ํ•ต์‹ฌ์ž…๋‹ˆ๋‹ค.

๊ณผ๊ฑฐ ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ์—์„œ ํ•™์Šต๋œ ๋ชจ๋ธ์˜ ์ผ๋ถ€์ž…๋‹ˆ๋‹ค.

ํ†ต๊ณ„์  ๊ด€์ ์—์„œ๋Š”

๊ฐ€์šฐ์Šค ๋ถ„ํฌ์™€ ๊ฐ™์€ ๋ณ€์ˆ˜์— ๋Œ€ํ•œ ๋ถ„ํฌ๋ฅผ ๊ฐ€์ •ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

๊ฐ€์šฐ์Šค ๋ถ„ํฌ์˜ ๋‘ parameter๋Š” ํ‰๊ท (ฮผ\mu)๊ณผ ํ‘œ์ค€ํŽธ์ฐจ(ฯƒ\sigma)์ด๊ณ , ์ด๋Ÿฌํ•œ paramter๊ฐ€ data์—์„œ ์ถ”์ •๋˜๊ณ  ์˜ˆ์ธก ๋ชจ๋ธ์˜ ์ผ๋ถ€๋กœ ์‚ฌ์šฉ๋  ์ˆ˜ ์žˆ๋Š” machine learning์—์„œ๋„ ์ ์šฉ๋ฉ๋‹ˆ๋‹ค.

ํ”„๋กœ๊ทธ๋ž˜๋ฐ ๊ด€์ ์—์„œ

paramter๋ฅผ ํ•จ์ˆ˜์— ์ „๋‹ฌํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ด ๊ฒฝ์šฐ์˜ paramter๋Š” ๊ฐ’ ๋ฒ”์œ„์ค‘ ํ•˜๋‚˜๋ฅผ ๊ฐ€์งˆ ์ˆ˜ ์žˆ๋Š” ์ธ์ˆ˜ ์ค‘ ํ•˜๋‚˜์ž…๋‹ˆ๋‹ค.

ML์—์„œ ์‚ฌ์šฉ ์ค‘์ธ ํŠน์ • model์€ function์ด๋ฉฐ data์— ๋Œ€ํ•œ prediction์„ ์ˆ˜ํ–‰ํ•˜๊ธฐ ์œ„ํ•ด paramter๊ฐ€ ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค.

์ด๋•Œ ๋ชจ๋ธ์— ๊ณ ์ • ๋˜๋Š” ๊ฐ€๋ณ€ parameter ์ˆ˜๊ฐ€ ์žˆ๋Š”์ง€์˜ ์—ฌ๋ถ€๊ฐ€ โ€œparametricโ€ or โ€œnonparametricโ€œ์„ ๊ฒฐ์ •ํ•ฉ๋‹ˆ๋‹ค.


Parametric model

parametric model์€ ๋ฐ์ดํ„ฐ๊ฐ€ ํŠน์ • ๋ถ„ํฌ๋ฅผ ๋”ฐ๋ฅธ๋‹ค๊ณ  ๊ฐ€์ •ํ•˜๊ณ , ํ•™์Šต์„ ํ•˜๋ฉด์„œ ๊ฒฐ์ •ํ•ด์•ผ ํ•˜๋Š” ๋ถ„ํฌ์˜ parameter ์ข…๋ฅ˜์˜ ์ˆ˜๊ฐ€ ๋ช…ํ™•ํ•˜๊ฒŒ ์ •ํ•ด์ ธ ์žˆ์Šต๋‹ˆ๋‹ค.

๋ฐ์ดํ„ฐ์˜ ์ˆ˜์— ๋”ฐ๋ผ paramter์˜ ์ˆ˜๊ฐ€ ๋ณ€ํ•˜์ง€ ์•Š์Šต๋‹ˆ๋‹ค.

๋”ฐ๋ผ์„œ parametric model์€ model์˜ ํ˜•ํƒœ๋ฅผ ์ •ํ•˜๊ณ , ์ด model์˜ paramter๋ฅผ ํ•™์Šต์„ ํ†ตํ•ด ๋ฐœ์ „์‹œํ‚ค๋Š” ์•Œ๊ณ ๋ฆฌ์ฆ˜์ž…๋‹ˆ๋‹ค.


Non-parametric model

non-parametric model์€ ๋ฐ์ดํ„ฐ๊ฐ€ ํŠน์ • ๋ถ„ํฌ๋ฅผ ๋”ฐ๋ฅธ๋‹ค๋Š” ๊ฐ€์ •์ด ์—†๊ธฐ ๋•Œ๋ฌธ์— ํ•™์Šต์— ๋”ฐ๋ผ tuningํ•ด์•ผ ํ•  paramter๊ฐ€ ๋ช…ํ™•ํžˆ ์ •ํ•ด์ ธ ์žˆ์ง€ ์•Š์Šต๋‹ˆ๋‹ค.

๋”ฐ๋ผ์„œ non-parametric model์€ data์— ๋Œ€ํ•œ ์‚ฌ์ „ ์ง€์‹์ด ์ „ํ˜€ ์—†์„ ๋•Œ ์œ ์šฉํ•˜๊ฒŒ ์‚ฌ์šฉ๋ฉ๋‹ˆ๋‹ค.


Parametric vs Nonparametric Models

parametric model

  • parametric model์€ ฮธ\theta์˜ ์œ ํ•œ ์ง‘ํ•ฉ์„ ๊ฐ€์ •
  • paramter๊ฐ€ ์ฃผ์–ด์งˆ ๋•Œ, ์˜ˆ์ธก๋œ ๊ฐ’ xx๋Š” data ์ง‘ํ•ฉ DD์™€ ๋ฌด๊ด€ํ•จ
  • ๋”ฐ๋ผ์„œ paramter ฮธ\theta๋Š” ๋ฐ์ดํ„ฐ์— ๋Œ€ํ•ด ์•Œ์•„์•ผ ํ•  ๋ชจ๋“  ๊ฒƒ์„ ์‚ดํŽด๋ด…๋‹ˆ๋‹ค.
  • ๋ฐ์ดํ„ฐ๊ฐ€ ํŠน์ • ๋ถ„ํฌ๋ฅผ ๋”ฐ๋ฅธ๋‹ค๋Š” ๊ฐ€์ •์„ ํ•˜๊ธฐ ๋•Œ๋ฌธ์— flexibility๊ฐ€ ๋‚ฎ์Œ
  • ๋ฐ์ดํ„ฐ์˜ ์–‘์ด ์ œํ•œ๋˜์ง€ ์•Š๋”๋ผ๋„ ๋ชจ๋ธ์˜ ๋ณต์žก์„ฑ์ด ์ œํ•œ๋จ

Nonparametric Models

  • Nonparametric Models์€ ๋ฐ์ดํ„ฐ ๋ถ„ํฌ๊ฐ€ ์œ ํ•œํ•œ parameter ์ง‘ํ•ฉ์œผ๋กœ ์ •์˜๋  ์ˆ˜ ์—†๋‹ค๊ณ  ๊ฐ€์ •ํ•จ
  • ๋ฌดํ•œํ•œ ์ฐจ์›์„ ๊ฐ€์ง„๋‹ค๊ณ  ๊ฐ€์ •ํ•  ์ˆ˜ ์žˆ์Œ
  • ๋ณดํ†ต parameter๋ฅผ function์ด๋ผ ์ƒ๊ฐํ•จ
  • ๋ฐ์ดํ„ฐ์—์„œ ์•Œ ์ˆ˜ ์žˆ๋Š” ์ •๋ณด์˜ ์–‘์€ ๋ฐ์ดํ„ฐ์˜ ์–‘์— ๋”ฐ๋ผ ๋น„๋ก€ํ•จ

ํ‘œ๋กœ ์ •๋ฆฌ

parametric modelnon-parametric model
์ •์˜ํŒŒ๋ผ๋ฏธํ„ฐ์˜ ๊ฐœ์ˆ˜๊ฐ€ ๊ณ ์ •๋œ ๋ชจ๋ธ๋ฐ์ดํ„ฐ ์ƒ˜ํ”Œ๊ณผ ๊ฑฐ์˜ ๋™์ผํ•˜๊ฑฐ๋‚˜ ๋น„๋ก€ํ•˜๋Š” ๋ชจ๋ธ
์ข…๋ฅ˜linear regression, logistic regression, bayes inference, neural network(cnn, rnn ๋“ฑ)decison tree, random forest, K-NN classifier
ํŠน์ง•๋ฐ์ดํ„ฐ๊ฐ€ ๋งŽ์„์ˆ˜๋ก ์ •ํ™•๋„๊ฐ€ ์˜ฌ๋ผ๊ฐ๋ฐ์ดํ„ฐ๊ฐ€ ํŠน์ • ๋ถ„ํฌ๋ฅผ ๋”ฐ๋ฅธ๋‹ค๋Š” ๊ฐ€์ •์„ ํ•˜์ง€ ์•Š์•„ ๋” flexibleํ•จ
ํ•œ๊ณ„๊ณ ์ •๋œ paramter๋กœ๋Š” ๋” ํฐ ๋ฐ์ดํ„ฐ๋ฅผ ์ฒ˜๋ฆฌํ•  ์ˆ˜ ์—†์Œ์†๋„๊ฐ€ ๋Š๋ฆฌ๊ณ , ๋งŽ์€ ๋ฐ์ดํ„ฐ๋ฅผ ํ•„์š”๋กœ ํ•˜์ง€ ์•Š์Œ, ๋ชจ๋ธ์˜ ํ˜•ํƒœ์— ๋Œ€ํ•œ ๋ช…ํ™•ํ•œ ์„ค๋ช…์ด ์–ด๋ ค์›€
profile
Tistory๋กœ ์ด์‚ฌ๊ฐ”์–ด์š”

0๊ฐœ์˜ ๋Œ“๊ธ€