[논문 리뷰] Road Damage Detection Using YOLO with Smartphone Images

Jua KIM·2022년 10월 28일
0

paper-review

목록 보기
1/1

Abstract

이 논문은 YOLO를 이용하여 도로에서 다양한 파손된 부분을 검출하는 방법을 설명한다. YOLOv5x 모델은 가볍고 빠르지만 좋은 정확도까지 가지고 있다. TTA를 사용한 앙상블 모델로 F1 score 0.58을 얻었다.

1. Introduction

본 대회에서, 데이터 셋은 스마트폰 베이스 방법으로 수집 되었다.

2. Related work

A. Road Damage Dataset

데이터 개수, 해상도

Country# of dataResolution
Czech3,595720 x 720
India9,892720 x 720
Japan13,133600 x 600
Total26,620
  • data format: JPEG

Damage type

Damage typeDetail InformationClass name
Crack(longitude)Wheel-marked partD00
Crack(Transverse)Equal intervalD01
Crack(Alligator)Partial / Overall pavementD20
Other DamagePatholeD40

3. Experiments

  • Model: YOLOv5 사용
    당시의 YOLO 중 SOTA model 이었다. YOLO v5는 CSPNet 기반의 모델이고, SPP(Spatial Pyramid Pooling layer)를 사용한다.

  • V100 GPU 2대를 사용하였고, COCO dataset 대상으로 pretrained 된 weight을 fine-tuning해서 사용하였다.

  • Japan 데이터셋 중에 대회에서 사용 되지 않는 class들이 포함되어 있어서 제거 했다.

  • Preprocessing 한 후 데이터 셋

Country# of dataResolution
Czech1,072720 x 720
India3,223720 x 720
Japan7,900600 x 600
Total12,195
  • training: 80%, validation: 20%

  • Data augmetation option: hue, saturation, value for HSV, image translation, image scale, mosaic, etc

  • default hyperparamenter

hyper-parametersvalue
OptimizerSGD
Learning rate0.01
Momentum0.937
weight decay0.0005
epochs50
batch size32
confidence threshold0.4
NMS with the IoU0.5

  • Japan 과 Czech 이미지 데이터셋을 함께 validation set으로 사용 하는 것은 Czech나 India dataset을 single로 사용 했을 때 보다 성능이 좋았다.

  • Table 2에서 Dataset의 의미는 학습데이터셋을 의미하고 model name의 의미는 데이터셋을 나누는 버전에 따라 이름을 지엇다. 예를들어 Japan1K_Czech_1은 1000개의 Japan이미지와 Czech road image version 1을 의미하고 Czech road image type을 예측한 모델이다.

4. Results

multi-country dataset으로 앙상블 모델을 사용하였다. confidence threshold는 0.4, NMS with IoU는 0.5이다. TTA(Test-Time Augmentation)을 적용하였지만 효과는 없었다. test1 dataset에 대해서 F1 score 0.568, test2 dataset에 대해서 F1 score 0.571을 얻었다.

profile
AI/ML engineer

0개의 댓글