Leave-One-Out Cross-Validation 이란?
모델 평가를 위한 교차 검증 기반 기법중 하나입니다.
이를테면 이 방법은 데이터셋의 각 샘플을 한번씩 테스트 세트로 사용하고, 나머지 샘플들을 학습 세트로 사용하는 방식입니다.
작동방식은 다음과 같습니다.
- 데이터셋에서 하나이 샘플만을 남기고 나머지 샘플들을 학습 데이터로 사용합니다.
- 남겨진 샘플 제외한 데이터로 모델을 학습합니다.
- 첫번째 단계에서 남은 샘플로 평가합니다.
- 이 방식을 모든 분할한 샘플에서 대해서 한번씩 테스트 세트로 사용되게 합니다.
- 모든 결과를 평균내서 최종 성능 지표를 계산합니다.
장점
- 모든 데이터를 사용할 수 있습니다.
- 편향이 감소합니다.
단점
- 계산 비용이 데이터셋의 크기에 비례하기 때문에 비용이 아주 높아질 수 있습니다.
- 분산이 이상해 질 수 있습니다.
데이터셋의 크기가 작고 각 샘플이 중요하다고 느껴질 때 사용하면 좋습니다.!!