[혼공학습단 9기] 혼자 공부하는 머신러닝 + 딥러닝 Ch 05

수빈·2023년 2월 5일
0
post-thumbnail

05-1 결정 트리

[기본 미션] 교차검증을 그림으로 설명하기

머신러닝에서는 학습한 모델의 성능을 평가하는 과정이 필요하다. 이 때 학습용, 평가용 데이터가 있어야 한다. 이 데이터를 어떻게 나누느냐에 따라 성능을 평가한 결과가 달라진다.

교차검증은 흔히 k-fold 교차검증의 형태로 나타난다. 위처럼 학습용, 평가용 데이터를 나누는 방법론 중의 하나인데, 교차검증이란 데이터를 여러 번 반복해서 나누고, 여러 모델을 학습하여 성능을 평가하는 방법이다. 데이터를 학습용/평가용 데이터 세트로 여러 번 나누어 평균적인 성능을 계산할 때, 한 번 나누어서 학습하는 것에 비해 일반화 된 성능을 얻을 수 있기 때문에 이러한 방식을 사용한다. 기존 대비 안정적이고 뛰어난 통계적 평가 방법으로 평가받는다.

데이터를 k개로 분할한 뒤, (k-1)개를 학습용 데이터 세트로, 1개를 평가용 데이터 세트로 사용한다. 그리고 이 방법을 k번 반복하여 k개의 성능 지표를 얻어내는 방법이다.

profile
CS공부 하고 있는 수빈입니다.

0개의 댓글