[ML] K-Fold Cross Validation

data_buddha·2023년 7월 16일
0

K-Fold Cross Validation

  • 학습 Data 분할 -> 검증 Data 생성
  • Test data로 평가(수능) 전, 학습 Data를 더 다양화시켜 모델을 잘 훈련시키는 것(수차례의 모의고사)
  • K = 5인 경우, 5번의 평가의 평균값을 최종 평가로 정의

Stratified K-Fold

  • imbalanced한 클래스 분포를 가진 Data를 위한 K-Fold 방식
  • 학습 데이터와 검증 데이터가 가지는 클래스 분포를 유사하도록 검증 데이터를 추출
  • ex) 카드사에서 Fraud 예측 분류할 때,
    전체 20000건의 데이터 중, 정상이 19900건, 사기 100건이라고 가정하면 일반적인 K-Fold 사용 시, 100건에 대한 학습을 제대로 할 수 없음
profile
来日方长 : 앞길이 구만리 같다; 앞길이 희망차다. 장래의 기회가 많다.

0개의 댓글