fold는 접는다는 뜻이다.
k fold는 k회 접는다는 것이다.
이전에 holdout에서는 데이터를 train, test 셋으로 나누었다.
이번에는 k개의 균등한 데이터로 나누는 것이다.
그리고 나눈 데이터 집합에 번호를 붙이면,
1, 2, 3 ... k가 될 것이다.
그럼 최초에는 k를 test 셋으로 하고 학습 & 정확도 측정,
이후 k-1을 test 셋으로 하고 학습 & 정확도 측정,
이후 k-2을 test 셋으로 하고 학습 & 정확도 측정,
...
1을 test 셋으로 하고 학습 & 정확도 측정
이런 식으로 학습과 검증을 반복하는 방식이다.
그럼 k개의 정확도를 구할 수 있는데, 여기에 평균을 취했을 때
k fold 교차검증의 정확도를 알 수 있다.
이러한 학습 모델 검증 방식은 데이터셋의 특성에 따라 결정해야 한다는데
나는 아직은 잘 모르겠다.