데이터 수집
타깃/입력 데이터 분리
데이터 전처리
SGDClassifier 모델 생성
학습 결과 및 검증
점진적인 학습 진행
적은 에포크 = 과소 적합
과한 에포크 = 과대 적합
조기 종료 : 과대 적합이 발생하기 전에 훈련 종료
다중분류 실시
7개의 생선
반복 학습 100 즈음 훈련 점수와 테스트 점수의 변화가 사라지며 오히려 점수의 격차가 벌어진다.
최적의 에포크 값 설정
위의 그래프를 기준으로 약 100회쯤이 훈련 세트와 테스트 세트의 정확성을 고려하여 최적의 결과를 나타낸다.