[논문 리뷰] SSD: Single Shot MultiBox Detector

PROLCY·2024년 3월 23일
0

인공지능

목록 보기
26/37

오늘은 SSD: Single Shot MultiBox Detector에 대한 간단한 리뷰이다.

The Single Shot Detector(SSD)

Model


SSD의 모델 구조는 위와 같이 생겼다. 이전의 feature map을 conv layer에 태운 후 뒤쪽에 붙여져서 multi-scale로 추론하는 효과를 가져오고, bounding box를 추론할 때 고정된 크기와 비율의 bounding box를 가지고 offset을 추론하는 방식을 사용한다.

Training

학습을 할 때는 bounding box의 후보군들 중에서 ground truth와 0.5 이상의 IoU를 가지는 box로 학습을 진행한다.

또한 Loss는 위와 같이 정의한다.

또한 고정된 크기와 비율의 default box를 feature map에 적용하고, 다양한 크기의 feature map에 수행하고 이를 합침으로써 성능을 향상시키려고 하였다.

Experimental Results



VOC2007 데이터셋에 대한 성능은 위와 같고, 데이터 augmentation을 적용했을 때, 더 많은 default box shape를 사용했을 때 성능이 더 잘 나왔다. 또한 DeepLab에서 사용한 atrous를 사용했을 때 속도가 더 빨라졌다고 한다.

또한 여러 개의 layer에서 여러 스케일로 default box를 사용하는 것이 성능을 높여준다는 것을 확인할 수 있었다.

VOC2012로 테스트한 성능이다.

COCO 데이터셋으로 테스트한 성능이다.

다른 방법론과도 비교했을 때, FPS도 나쁘지 않고 성능도 준수한 모델이 바로 SSD이다.

후기

오늘은 SSD에 대해 간단히 알아봤다. feature map을 분할한 후, 각 feature map마다 고정된 박스들을 할당하여 추론하고, 각 레이어에서의 feature map이 나중의 끝 레이어에 반영되는 것이 특징인 모델이었다. 속도도 빠르고 성능도 나쁘지 않은 모델이었다.

0개의 댓글