ㅤ
ㅤ
ㅤ
모델이 얼마나 잘 맞추는지 평가하고 싶을 땐 뭘 해야할까?
ㅤ
ㅤ
Training set
을 사용해 모델을 평가할 수 있다.
모든 training set을 모델에 학습 시켜버리면 중간고사 시험지를 외우는 것 마냥 제대로된 모델이 나오지 않는다.
따라서 Training set을 30%와 70%로 나누어줘야한다.
Training set
Testing set
ㅤ
ㅤ
Training set은 교과서, Test set은 시험지라고 생각하면 된다.
말 그대로 training set으로 학습한 모델이 test set으로 시험해본다는 의미다.
Testing set은 학습하는 단계에서 모델에 사용하면 안된다.
중간고사 시험지의 답안지를 외우는 꼴이기 때문이다.
ㅤ
ㅤ
ㅤ
ㅤ
Training set을 두개로 나누어
Training set
과 Validation set
으로 나타낼 수 있다.
ㅤ
ㅤ
사용 방법은 간단하다.
(모의 시험을 치는 단계라고 생각하면 된다.)
ㅤ
ㅤ
ㅤ
ㅤ
data set이 많은 경우에 모델을 학습시키려면 어떻게 해야할까?
ㅤ
ㅤ
간단하게 데이터를 나눠서 학습시키면 된다.
100만개의 데이터를 10만개씩 모델에 10번 학습 시키는 것과 같은 것이다.
추가 학습에 좋다.
ㅤ
ㅤ
ㅤ
ㅤ
사람들이 직접 적은 숫자로 실제 데이터로 사용한다.
이것 또한