sep='\s+' -> 데이터를 읽을 때 열을 구분하는 구분자(separator)를 지정하는 것
교차검증 - 나에게 주어진 데이터에 적용한 모델의 성능을 정확히 표현하기 위해서 유용함.
검증(validation)
KFold란?
k-fold cross-validation(k-겹 교차 검증)은 가장 널리 사용되는 교차 검증 방법의 하나로, 데이터를 k개로 분할한 뒤, k-1개를 학습용 데이터 세트로, 1개를 평가용 데이터 세트로 사용하는데, 이 방법을 k번 반복하여 k개의 성능 지표를 얻어내는 방법
출처: https://www.incodom.kr/k-%EA%B2%B9_%EA%B5%90%EC%B0%A8_%EA%B2%80%EC%A6%9D
grid_cv = GridSearchCV(dt_clf, param_grid=params,
scoring='accuracy',
cv=5,
return_train_score=True)
grid_cv.fit(X_train, y_train)