머신러닝 필수 개념: Regularization과 Generalization 정리

Bean·2025년 6월 18일
0

인공지능

목록 보기
52/123

머신러닝의 핵심: Regularization과 Generalization 쉽게 정리하기

머신러닝과 딥러닝 모델을 공부하다 보면 Regularization(정규화)Generalization(일반화) 은 꼭 짚고 넘어가야 하는 핵심 개념입니다.
둘 다 공통 목표는 과적합(overfitting) 을 방지하고, 현실 세계 데이터에도 잘 작동하는 모델을 만드는 데 있습니다.


1. Generalization (일반화)

Generalization이란?

모델이 훈련 데이터에서 배우지 않은 새로운 데이터(test data) 에도 잘 작동하는 능력을 말합니다.

좋은 일반화란?

  • 학습 데이터에만 딱 맞춘 모델이 아니라, 실제 환경에서도 높은 정확도를 보장하는 모델입니다.
  • 훈련 정확도는 높지만 테스트 정확도가 낮으면 → 일반화가 부족한 상태입니다.

일반화와 관련된 문제

  • Underfitting (과소적합)
    모델이 너무 단순해서 데이터 패턴을 제대로 못 배움.
  • Overfitting (과적합)
    모델이 너무 복잡해서 훈련 데이터에는 완벽하지만 새로운 데이터에는 약함.

2. Regularization (정규화)

Regularization이란?

과적합을 줄이기 위해 모델의 복잡도를 제어하거나 추가적인 제약을 가하는 방법입니다.

목적

모델이 훈련 데이터에 과하게 적응하지 않고, 일반화 성능을 높이는 것이 주된 목적입니다.


3. 대표적인 Regularization 기법

기법설명
L1 정규화 (Lasso)가중치의 절댓값 합을 줄여서 일부 가중치를 0으로 → 특징 선택(feature selection) 효과
L2 정규화 (Ridge)가중치의 제곱합을 줄여서 전체 가중치를 작게 유지
Dropout학습 시 일부 뉴런을 랜덤하게 꺼서 특정 뉴런에 대한 의존도 감소 → 앙상블 효과
Early Stopping검증 성능이 떨어지기 시작하면 학습을 조기 종료 → 과적합 방지
Data Augmentation데이터 변형으로 데이터 다양화 → 일반화 능력 향상
Batch Normalization학습 안정화 + 일부 정규화 효과

4. Regularization & Generalization 관계 정리

정리하자면:

  • Regularization은 좋은 Generalization을 위해 사용되는 도구입니다.
  • 목표는 테스트 데이터에서도 높은 성능을 내는 것!
  • Regularization을 통해 모델의 학습을 덜 민감하게 만들어 새로운 데이터에도 강하게 만듭니다.

profile
AI developer

0개의 댓글