[DL-Basic 정리][Neural Network 최적화] Regularization 관련 주요 용어 정리

mincheol2·2022년 2월 8일

DL Basic Regularization

DeepLearningBasic

목록 보기

3/7

이 글은 부스트캠프 AI Tech 3기 강의를 듣고 정리한 글입니다.

Regularization

이 글에서는 Neural Network을 최적화 하기위한 Regularization(정규화) 에 대한 주요 용어의 concept를 알아보도록 하자.

보통 Regularization 은 일반화(generalization) 가 잘되도록 하기 위한 것으로 학습을 방해(제약을 주어서)하여 test 시에도 잘되도록 하는 것을 의미한다.

하지만 학습에 제약을 준다는 concept은 크게 신경 쓰지 않고, 일반화 성능을 높이기 위한 기법이라고 생각하는게 맘이 편해질 것이다.

Earlystopping

학습을 너무 많이 시키면 과적합(Overfitting)이 일어나면서 train 성능은 좋아지지만, test 성능은 나빠지는 경우가 발생한다.
이를 방지하기 위해 과적합이 일어나는 것 같으면 모델의 학습은 일찍 멈추는 것을 뜻한다.

Parameter Norm Penalty (Weight Decay)

$W$ 에 관해서 최대한 부드러운 함수를 만드는 것이 일반화가 잘될 것이다.
즉, $W$ 를 크기 관점에서 작게하는게 좋다.
이를 구현하기 위해 Loss Function에 $W$ 의 크기 항을 추가하여 $W$ 의 크기도 작게하는 방향으로 학습하게 한다.

Data Augmentation

데이터가 많이 없으면, 기존의 ML 기반 모델이 더 성능이 좋다.(DL은 안될 가능성이 높다)
반대로 데이터가 많으면, 기존의 ML 기반 모델은 표현력이 떨어지게 되고, DL의 성능이 올라간다(DL은 데이터가 많을수록 표현력이 좋다)

따라서 성공적인 DL을 위해서는 데이터를 많이 넣는게 좋은데, 현실적으로 어려운 경우가 많기 때문에 데이터를 살짝 변형하여 데이터를 증강(Augmentation) 시킨다.
대표적인 예로 CV에서는 이미지를 그림과 같이 변형해서 데이터를 늘린다.