일반화, 과대적합, 과소적합

Happy_JG·2023년 8월 28일
0

머신러닝

목록 보기
5/16

머신러닝 궁극적인 목표

모델의 신뢰도를 측정하고, 성능을 확인하기 위한 개념으로 일반화 성능이 최대가 되는 모델을 찾는 것을 목표로 과대적합, 과소적합을 지양해야한다.

과대적합(Overfitting)

훈련 세트에 너무 맞추어져 있어 테스트 세트의 성능 저하

공의 종류는 다양하지만, 축구공만 설명

  • 둥글다.
  • 오각형과 육각형으로 이어졌다.
  • 검은색과 흰색으로 구성된다.
  • 반짝반짝 광이난다.
  • tmi

규칙이 복잡하고 너무 상세하다. 적절한 선별이 어렵다.

과소적합(Underfitting)

훈련 세트를 충분히 반영하지 못해 훈련 세트, 테스트 세트에서 모두 성능이 저하

공의 특징은 다양하지만 단순하게 설명

  • 둥글다.

규칙이 단순하고 간단하다. 적절한 선별이 어렵다.


모델의 복잡도 해결

일반적으로 데이터 양이 많으면 일반화에 도움이 된다.
주어진 훈련데이터의 다양성이 보장되어야 한다.
편중된 데이터를 많이 모으는 것보다 다양한 데이터 포인트를 골고루 나타내야 한다.
규제(Regularization)을 통해 모델의 복잡도를 적정선으로 설정한다.

profile
hello!

0개의 댓글

관련 채용 정보