ML lec 07-2

예설·2023년 7월 31일
0

ML

목록 보기
10/21
post-thumbnail

lec 07-2

Contents

  • Training set and test sets
  • Training, validation and test sets
  • Online learning
  • MINIST Dataset

Training set and test sets

모델이 얼마나 잘 맞추는지 평가하고 싶을 땐 뭘 해야할까?

Training set을 사용해 모델을 평가할 수 있다.

모든 training set을 모델에 학습 시켜버리면 중간고사 시험지를 외우는 것 마냥 제대로된 모델이 나오지 않는다.

따라서 Training set을 30%와 70%로 나누어줘야한다.

  • 70% = Training set
  • 30% = Testing set

Training set은 교과서, Test set은 시험지라고 생각하면 된다.
말 그대로 training set으로 학습한 모델이 test set으로 시험해본다는 의미다.

Testing set은 학습하는 단계에서 모델에 사용하면 안된다.
중간고사 시험지의 답안지를 외우는 꼴이기 때문이다.

Training, validation and test sets

Training set을 두개로 나누어
Training setValidation set으로 나타낼 수 있다.

사용 방법은 간단하다.

  1. Training set으로 모델을 학습시킨 후에
  2. Validation set을 사용해 모델을 튜닝한다.

(모의 시험을 치는 단계라고 생각하면 된다.)

  1. 튜닝이 완벽하다 싶으면 Testiong set을 사용하여 모델을 테스트한다.

Online learning

data set이 많은 경우에 모델을 학습시키려면 어떻게 해야할까?

간단하게 데이터를 나눠서 학습시키면 된다.

100만개의 데이터를 10만개씩 모델에 10번 학습 시키는 것과 같은 것이다.

추가 학습에 좋다.

MINIST Dataset

사람들이 직접 적은 숫자로 실제 데이터로 사용한다.

이것 또한

  • Training set
  • Testing set
    으로 나누어진다.
profile
주니어 백엔드 개발자 조예설입니다.

0개의 댓글