Cross Validation은 주어진 문제에 대하여 Train, Validation Set으로 나누어 모델의 성능을 체크함에 있어 나누어진 집합에 편향성을 가질수 있는 문제를 해결하기 위한 방법입니다. Cross Validation 기법의 가장 대표적인 예로 K-fold Cross Validation을 설명드리면 우선 Train 데이터 셋을 k등분 하여 그 중 하나를 Validation Set으로 하여 검증하고, 또 다른 하나를 Validation Set으로 하여 검증하는 식으로 k번 반복하도록 하고 이를 평균내어 그 편향성을 줄일 수 있습니다.
하지만 이런 방법도 편향을 가질 수 있기 때문에 실제 Class의 분포를 기반으로 추출하는 stratified K Fold 방식을 활용할 수 있습니다.