정의: 리지 회귀는 손실 함수에 규제 항을 추가하여 과적합을 방지하는 선형 회귀 모델입니다. L2 정규화를 통해 모델의 가중치(계수)가 너무 커지지 않도록 제약을 주며, 이로 인해 모델의 복잡도가 낮아져 일반화 성능이 개선됩니다.
수학적 표현:
: 평균 제곱 오차로, 예측값과 실제값 간의 오차를 나타냅니다.
: 규제 파라미터 (하이퍼파라미터로, 모델이 학습 중에 적용할 규제의 정도를 조절)
: 가중치 의 제곱합을 더하여 큰 가중치가 발생하는 것을 억제합니다.
이 식에서 가 클수록 규제가 강해지면서 가중치가 작아지며, 과적합이 줄어들지만 모델의 학습 능력도 약해질 수 있습니다.
활용: 데이터가 다중 공선성 문제를 가질 때 효과적이며, 모델의 일반화 성능을 높여줍니다.
L2 정규화:
L2 정규화 예시
가중치 크기를 억제하는 것이 왜 중요한지 간단한 예시로 살펴보겠습니다.
예를 들어, 주택 가격 예측을 위해 가구 수, 방 개수, 평수 등 여러 변수를 이용한다고 가정해봅시다.
특정 변수(예: 방 개수)의 가중치가 매우 크다면, 모델은 이 변수에 크게 의존하게 되어 다른 변수들의 영향력이 무시될 가능성이 큽니다.
L2 정규화는 이러한 큰 가중치를 억제하여 모든 변수들이 모델 학습에 골고루 기여할 수 있도록 돕습니다.
비유로 설명: 마치 균형 잡힌 요리에서 특정 재료의 맛이 너무 강해지지 않도록 조절하는 것과 같습니다. 각 재료가 적절한 역할을 해 조화를 이루게 하는 것이 모델의 과적합을 방지하는데 중요한 역할을 합니다.
한계: 규제가 너무 강하면 모델의 성능이 저하될 수 있습니다.