딥러닝 프로젝트(https://github.com/addinedu-ros-3rd/deeplearning-repo-4)에서 서로 다른 버전의 YOLO를 사용했고 그 중에 가장 성능이 좋았던 모델은 YOLOv5n으로 100회 학습한 모델이었다.
근데 버전별로 뭐가 다르냐고 묻는다면 안에 돌아가는 로직은 정말 모르는 상태. 논문과 공식 git 저장소 설명을 봐도 잘 이해가 되진 않습니다... Vision Transformer 써보고 싶었는데 잘 안 되어서 급히 객체인식을 했던 거기도 하고.
그래도 간략히 정리해 보자면,
버전별로 학습하는 구조가 다르기 때문에 데이터 학습 시 필요한 yaml 파일 포맷도 차이가 있다.
성능 면에서는, 전에 작성했던 포스트(https://velog.io/@yun5/yolo-v3-v5-v8-train)를 보면, mAP50-95 수치상 YOLOv8로 학습한 모델이 더 나았음에도 수치가 더 낮은 YOLOv5에서 학습한 모델의 성능이 나은 것으로 보였다. 즉, 사람 눈으로 봤을 때의 분류와 가장 일치한 것은 YOLOv8에서 학습한 모델이 아니었다. 데이터에 따라 맞는 모델은 다른 것 같다고 판단했지만, 학습 설정값을 더 조정했어야 했을 수도 있다.
[참고자료]