데이터 세트의 종류엔 뭐가 있을까?

박민서·2023년 8월 31일

스펀지

목록 보기
1/7

보통 머신러닝이나 딥러닝에서 데이터 세트는 크게 세 가지로 나뉩니다.

  1. 학습데이터(Training Data): 모델이 학습하는 데 사용되는 데이터

  2. 검증데이터(Validation Data): 학습 중 모델의 성능을 평가하는 데 사용되는 데이터. 이 데이터를 사용하여 하이퍼파라미터를 조정하거나 모델의 구조를 변경할 수 있습니다.

  3. 테스트 데이터(Test Data): 학습이 완료된 후 모델의 최종 성능을 평가하는 데 사용되는 데이터입니다.

학습 중에는 검증 데이터에 대한 성능을 주기적으로 체크하여 모델의 학습 진행 상황을 모니터링합니다. 이때의 성능 측정값을 통해, 예를 들어 과적합(Overfitting)이 발생하고 있는지 확인할 수 있습니다.

학습이 완료된 후에는 테스트 데이터를 사용하여 모델의 최종 성능을 평가합니다. 이때의 성능 측정값은 모델이 실제로 얼마나 잘 동작하는지를 나타내는 지표로 사용됩니다.

0개의 댓글