교차검증을 그림으로 설명하기
- 교차검증이란 한정적인 데이터에서 최대한 많은 데이터를 테스트에 사용함으로써 훈련간 테스트 데이터에 과적합 되는 현상을 막기 위한 목적으로, 아래 그림과 같은 형태로 테스트 데이터를 생성한다.
- 분할된 갯수=K (ex. 5-Fold cross validate)
- 사이킷런의 cross_validation()을 사용하면 자체적으로 k의 수만큼 훈련을 수행하고 score를 반환한다.
- 사이킷런의 cross_validation()는 훈련세트를 섞지 않기에 순차적인 데이터를 그대로 사용하면 편향이 발생할 위험이 있다. 따라서 훈련세트를 섞기위해서 StratifiedKFold를 사용한다.

앙상블 모델 손코딩 인증하기
