과적합: 모델이 학습 데이터에만 과도하게 최적화되어 일반화된 데이터에서는 예측 성능이 과하게 떨어지는 현상
holdout

k-fold cross validation

stratified k-fold cross validation

검증 validation이 끝난 후 test용 데이터로 최종 평가
모델의 성능을 확보하기 위해 조절하는 설정 값

튜닝 대상
-> 결정나무에서 튜닝해 볼만한 것은 max_depth
-> 간단하게 반복문으로 max_depth를 바꿔가며 테스트해볼 수 있을 것

새로운 데이터가 있을 때, 기존 데이터의 그룹 중 어떤 그룹에 속하는지를 분류하는 문제
k는 몇번째 가까운 데이터까지 볼 것인가를 정하는 수치

k=5로 설정하면 5번째까지 가까운 데이터
k값에 따라 결과값이 바뀔 수 있음

거리를 계산하는 것 -> 유클리드 기하

이 글은 제로베이스 강의 자료 일부를 발췌하여 작성되었습니다