Cross Validation이란?
Cross Validation 기법 종류 K-Fold Cross Validation(k-겹 교차 검증)
Stratified k-fold cross validation(계층별 k-겹 교차검증)
데이터 셋을 Train Set과 Test Set 두 세트로 나누는 과정일정 비율로 설정Train Set이 작으면 모델 정확도의 분산 증가 -> 과소적합 가능성 상승반대로, Train Set이 커지면 과대적합 가능성 상승최고의 효율을 내기 위해 Random Subsamp
전체 데이터 중에서 p개의 샘플을 선택 -> 모델 검증에 사용따라서, test set을 구성할 수 있는 경우의 수$$nCp$$ : 조합 각 데이터 폴드 세트의 검증 결과들을 평균 -> 최종적인 검증 결과를 도출하는 것이 일반적 데이터 폴드 세트의 경우의 수가 매우 크기
참고데이터사이언스 인터뷰 질문모음(https://zzsza.github.io/data/2018/02/17/datascience-interivew-questions/회귀 문제에서는 실제 값과 모델이 예측하는 값의 차이에 기반을 둔 metric(평가)을 사용합니다
지도학습 > 지도학습 : 분류와 회귀에 사용 데이터의 정답(label)을 알려주고 학습 비지도학습 > 비지도학습 : 군집화와 차원축소에 사용 데이터의 정답(label)을 알려주지 않고 학습
ㅇ