정규화(Regularization) 요약

oneofakindscene·2021년 8월 11일

Data Science

목록 보기

7/7

모델을 조금 더 General하게 만들고자 하는 것 = 모델의 오버피팅(Overfitting)을 줄이고자 하는 것
모델을 학습시킨다는건 결국 모델의 Weight matrix를 좋은 방향으로 업데이트해나가는 것
- Weight 중 일부가 학습과정 중 과도하게 커져버린다면, 몇몇개의 인풋에 극단적으로 의존하는 상황이 벌어지고, 이 경우 모델의 일반화 성능은 감소할 것
- 특정 Weight가 과도하게 커지지 않게끔 락(Lock)을 걸어주는 역활을 L1, L2 정규화가 해줍니다.
- (참고) 모델의 Weight matrix size가 너무 작다면, 이런일이 발생할 수 있습니다. 때문에 뉴럴넷를 설계할 때에는, 충분히 Weight matrix size를 Sparse할 수 있게끔 구축해야합니다
따라서, 정규화는 weight 정규화 를 뜻한다. = weight를 정규화해서 너무 커지는 것을 방지해준다.

수식
위 스샷들 중에서 Cost의 Loss function 부분의 summation of xw 부분이 첫번째 스샷에서 $y_{predicted}$ 를 의미
L1 Regularization이라는 건 결국 L1 Loss 에 Regularization Term을 붙인 것
기존 Loss에 절댓값만큼의 어떤 족쇄(패널티)를 달아줌으로써 Cost가 더 커지게 만든 셈인데, 이를 통해 특정 Weight의 중요도가 커지는 걸 막는다는 느낌(Cost가 커지면 Weight 중요도가 줄어드니깐)
저기서 $\lambda$ 가 작아질 수록, 약한 정규화가 적용
Sparse feature에 의존한 모델에 L1 Regularization을 사용하면, 불필요한 Feature에 대응하는 Weight를 정확히 0으로 만들어버려, Feature selection의 효과를 냄
(참고) L1 Regularization을 사용하는 선형 회귀 모델을 Lasso model이라고도 합니다.