[Andrew Ng] 2-3. Why Regularization Reduces Overfitting

Prettypotato·2026년 2월 15일

딥러닝 2단계: 심층 신경망 성능 향상시키기

목록 보기

5/15

How does regularization prevent overfitting?

Lambda를 크게 해서 w를 0에 가깝게 만들 수 있다.

w^{[l]} := (1-\frac{\alpha \lambda}{m})w^{[l]} - \alpha \cdot \frac{\partial J}{\partial w^{[l]}}

Weight의 값을 0에 가깝게 하여 더 간단하고 작은 신경망으로 만든다. 이를 통해 overfitting을 막을 수 있다.
- Weight이 0에 가까워지면, activation에 입력값도 0의 근처에 있게 되어있음.
- 이렇게 되면 Sigmoid, Tanh와 같은 Non-linear activation function들이 linear activation처럼 행동함.
- 비선형적인 특성이 줄어들어 overfitting을 방지할 수 있음.

출처 및 참고 자료

Andrew Ng, Improving Deep Neural Network, DeepLearningAI

이전 포스트

[Andrew Ng] 2-2. Dropout Regularization

다음 포스트

3-1. Normalizing Inputs

0개의 댓글