한이음 공모전을 위해 차량 및 장애물 인식을 위해 yolov5 custom train을 진행했다.
사용한 차량 DATASET
https://www.kaggle.com/rifat963/dhakaai-dhaka-based-traffic-detection-dataset
장애물데이터셋은 연구실에서 제공받아 학습을 진행하였다.
데이터들의 형식이 VOC형식으로 xml파일이였다. yolo에서 사용하는 것은 txt파일이기 때문에 전처리하는 과정을 추가해 주었다. 전처리하는 방식에 대해서는 추후에 글을 작성하겠다.
사용한 yaml파일
데이터셋을 확인했을 때, 동남아쪽 차량이 많아 공모전을 위한 학습에는 부적절하다는 생각이 들었지만 일단 결과를 확인하기 위해 진행하였다.
250epoch/ batch-size 2/ pre-trained yolov5x/ RTX 3080 사용/ input size 640
test 데이터에 대해서는 좋은 인식률을 보였다. mAP는 0.53정도로 나쁘지는 않았지만 고속도로 주행 영상에 대해서 detect를 진행했을 때, 좋지 않은 인식률을 보여 주었다. 기존의 pre-trained된 가중치를 사용했을 때, 결과과 더 좋은 것을 확인하였다.
현재 사용한 데이터셋은 내가 원하는 결과물을 제시하기에는 힘들었다. 기존의 pre-trained 가중치인 yolov5x를 사용하는 것이 더 효율적이라는 결론을 얻었다.
기존의 가중치를 이용하기 위해서는 필요 없는 class를 제거하고 장애물 class를 추가하는 과정이 필요하다.
이 과정을 진행 후에 글을 한번 더 작성하겠다.
안녕하세요. 비슷한 프로젝트를 진행중인데, 글을 읽고 궁금한 점이 생겨 이렇게 댓글 달았습니다.