데이터 항목을 보고
필요했던 부분을 더 채워 주거나, 불필요한 사진을 제거해야 함
이 과정을 "데이터 정재"라고 함
학습 샘플 == 트레이닝셋
테스트 샘플 == 테스트 셋
혼동 행렬
Y축 : 설정해 놓은 class 의미 (분류해놓은 카테고리)
X축 : prediction, 예측해서 분류할 수 있는 항목\
대각에 있는 수치들의 테스트 데이터셋이 전부 다 왔다는 라는 것
-> 학습이 잘 됨
성능 향상을 위해
1. 데이터 수집량 늘리기
2. 데이터 정제하기
3. 에포크, 배치 사이즈 적절히 조절하기
성능 평가 방법
1. 정확도 함수 그래프
2. 손실 함수 그래프
3. 혼동 행렬