트레이닝 셋을 라벨링을 통해 구현하여 사진을 추가해 라벨을 붙인다. 여러 각도로 사진을 추가해 다양한 데이터 수집하는 것이 중요하다. 만약, 출력의 정확도가 부족하다면 더 많은 데이터 수집을 통해 정확도를 높여 성능이 좋아지도록 해야 한다.
배경이 달라지면, 즉 환경이 변화하면 학습이 되지 않아 예측한 결과가 나오지 않을 수 있다. 그러므로 여러 형태, 각도, 주변 환경 등을 고려해서 학습을 모두 시켜야 한다.
색감이 확실하거나 특이한 형태를 지닌 경우 특징이 많아서 구분을 잘 할 수 있게 된다. 만약 구분이 잘 안된다면 데이터를 추가하거나 불필요한 데이터를 삭제해야 한다.
y축 : class
x축 : prediction - 예측해서 분류할 수 있는 항목
대각에 수치가 모두 위치했다면 학습이 매우 잘 되었다는 뜻
에포크 돌기 전에는 모든 데이터에 대해 손실이 큼
점차 손실이 줄어서 loss가 0에 가까워지게 된다.
물질의 특징이 확실하다면 test loss는 처음부터 0에 가까움
각 데이터 샘플 중에 85% = 트레이닝 셋
각 데이터 샘플 중에 15% = 테스트 샘플
정확도 그래프, 손실 그래프, 혼동행렬 그래프로 성능을 평가하고 비교할 수 있다.
이렇게 만든 모델은 링크나 코드로 변환해 어디서나 사용할 수 있다.