[ML] 딥러닝의 깊이 있는 이해를 위한 머신러닝 1-2 (K-MOOC)

daeungdaeung·2021년 6월 19일

Machine-Learning

목록 보기

2/25

해당 강의로는 Generative Model에 대한 이해가 부족하여 유튜브에서 허민석님의 설명을 참고하여 작성을 보완하였습니다.

그림 설명 (해당 그림은 허민석님의 유튜브를 참고하여 작성했습니다.)
- 현재 가지고 있는 데이터(초록색, 노란색 데이터)의 분포를 계산합니다. (위에서는 Gaussian Distribution을 사용했습니다.)
- 새로운 데이터(new data)는 어느 분포에 속할까요?
- 우리가 기존에 계산한 데이터의 확률 분포( $p(x|y=green )$ and $p(x|y=yellow)$ )를 이용하여 새로운 데이터가 어디에 속하는지 정합니다.
문제점 (단점)
- 기존에 사용된 샘플들과의 거리 값을 기준으로 분류하므로 새로운 feature가 입력되면 결과값이 나오지 않습니다.
관점의 전환 (장점)
- 새로운 샘플이 모르는 샘플이라는 결론을 내릴 때 장점이 됩니다.
Generative Model의 분류
- Parametric Model: 어떤 거리 값을 기반으로 값을 도출
- Non-parametric Model: 거의 모든 샘플들을 활용하는 모델

Discriminative Model 은 학습에 존재하는 데이터들을 활용하여 decision boundary를 도출합니다.

$y = f(\vec{w} \cdot \vec{x})=f(w_1x_1+w_2x_2+\dots+w_nx_n)$
( $y$ : label, $\vec{w}$ : weights(구하고자 하는 값), $\vec{x}$ : fetures)

머신러닝의 효율성을 높이기 위해 활용합니다.

Regularization

$\vec{w}$ 값 자체에 적용하게 되는 값
데이터에는 아무런 영향을 주지 않습니다.
$\vec{w}$ 값에 대해 제한을 거는 존재가 Regularization
선형 모델이 노이즈에 대해 강인함을 갖도록합니다.
L1-norm regularization & L2-norm regularization
- 특정 feature의 크기가 너무 커지지 않도록 제어하는 역할을 수행합니다.