k-겹 교차검증 이 먼대?!

주리·2023년 4월 10일
0

원래는 ...

  • 머신러닝을 학습시킬 때, 훈련 데이터 / 테스트 데이터로 나눈다
    ( 보통 70 : 30 으로 나눔 )
  • 70% 데이터를 모델 테스트 과정에서도 사용할 방법이 있다면 좋겠지?

k겹 교차검증

= 집합을 체계적으로 바꿔가면서 모든 데이터에 대해 모형의 성과를 측정하는 검증 방식

  • k겹 → 전체 데이터셋을 K개의 부분집합으로 나눈다
    ( fold = k 개로 나눈 부분집합 데이터 )

  • 교차 → fold 들을 차례대로 교차해 테스트 데이터로 사용
    ( 아래 그림을 보자 ! )

k-겹 교차검증의 흐름

  • 만약 우리가 모델의 정확도(accuracy)를 측정해보고 싶다면,
    1번 fold가 테스트 데이터일 때 모델을 학습시켜 정확도를 산출,
    2번 fold가 테스트 데이터일 때 모델을 학습시켜 정확도를 산출,
    3번 fold가 테스트 데이터일 때 모델을 학습시켜 정확도를 산출...
    이 과정을 k번 fold까지 반복
    → 모델 검증 결과가 k개 나온다
    → 이 k개의 결과물들의 평균값 = K겹 교차 검증 방식을 활용한 모델의 성능

참고사이트

https://bbdata.tistory.com/10

profile
완벽한 글 보다, 그 과정들을 기록하는 개발자

0개의 댓글