모델의 신뢰도를 측정하고, 성능을 확인하기 위한 개념으로 일반화 성능이 최대가 되는 모델을 찾는 것을 목표로 과대적합, 과소적합을 지양해야한다.
훈련 세트에 너무 맞추어져 있어 테스트 세트의 성능 저하
공의 종류는 다양하지만, 축구공만 설명
규칙이 복잡하고 너무 상세하다. 적절한 선별이 어렵다.
훈련 세트를 충분히 반영하지 못해 훈련 세트, 테스트 세트에서 모두 성능이 저하
공의 특징은 다양하지만 단순하게 설명
규칙이 단순하고 간단하다. 적절한 선별이 어렵다.
일반적으로 데이터 양이 많으면 일반화에 도움이 된다.
주어진 훈련데이터의 다양성이 보장되어야 한다.
편중된 데이터를 많이 모으는 것보다 다양한 데이터 포인트를 골고루 나타내야 한다.
규제(Regularization)을 통해 모델의 복잡도를 적정선으로 설정한다.