[Object Detection] Single Shot MultiBox Detector : SSD 논문 리뷰

tobigs1415 이미지 세미나·2021년 5월 22일
5

Tobigs1415 Image Semina

목록 보기
7/16
post-thumbnail

투빅스 14기 민거홍

SSD 논문 및 배경 소개

Object Detection 논문의 변천사와 SSD

Object Detection 혁신 과정과 SSD의 위치

|중요 개념| (CNN-based) 1-stage vs. 2-stage Object Detector


|중요 개념| Single-Shot이란?

왜 SSD논문을 쓰게 되었는가 - 배경 소개

SSD의 이론적 쟁점과 novelty

SSD의 novelty와 contributions

SSD Model - Base Network

SSD Model - Convolutonal Filter & Output-layer

SSD의 성능을 위해 활용한 요소들 - Multi-scale Feature Maps

SSD Training

Hard Negative Mining

SSD의 성능과 SSD 이후

SSD의 성능을 측정하기 위해 사용된 데이터셋

데이터셋 Visualization

SSD의 성능 향상을 위해 활용된 요소들 - Data Augmentation

SSD의 성능 향상을 위해 활용된 요소들 - Multi-scale Feature Maps

SSD의 성능 향상을 위해 활용된 요소들 - Boundary Boxes

SSD의 성능 비교 (PASCAL VOC2007기반)


SSD 이후: RefinaNet, RetinaNet 등

profile
2021 투빅스 14, 15기 이미지 세미나입니다😀

4개의 댓글

투빅스 14기 김민경

  • SSD는 CNN기반 1-stage Detector(classification, localization 동시에 진행) 모델의 새로운 지평을 열었다.
  • 당시 SOTA인 YOLOv1, Faster RCNN 등과 비교했을 때 성능과 속도 면에서 크게 개선된 결과를 보여주었다. by multi-reference & multi-resolution 분석
  • SSD는 Hard Negative Mining & Multi-Scale Detection을 제안하며 현재까지도 영향을 줄 정도의 혁신을 가져왔다.
  • SSD의 가장 큰 특징은 여러 크기의 Feature Map을 사용해 prediction함으로써 정확도를 최대 12% mAP까지 상승시켰다는 점이다.

대표적인 CNN기반 1-stage Detector인 SSD의 배경부터 속도와 정확도를 모두 잡을 수 있었던 혁신적인 아이디어들을 알 수 있었습니다. 이외에도 1-stage Detector에서 발생하는 class imbalance 문제를 해결하기 위해 loss function을 제시한 RetinaNet 등의 SSD 이후 논문들도 소개해주셨습니다. 감사합니다:)

답글 달기
comment-user-thumbnail
2021년 5월 25일

투빅스 14기 김상현

이번 강의는 SSD 논문 리뷰로 민거홍님께서 진행해주셨습니다.

  • SSD는 CNN기반 1-stage detector로 기존의 모델보다 빠른 detection speed와 높은 accuracy를 보여줬다.
  • Default box들 마다 CNN 필터를 적용하여 category score와 box offset을 예측했고, 서로 다른 피쳐맵에서 서로 다른 스케일의 예측을 진행해 정확도 향상을 이끌었다.
  • 성능을 높이기 위해 scale과 aspect ratio 관련 다수의 data augmentation기법을 적용했다.
  • Loss function으로 box parameter를 입력으로 Smooth L1 loss와 class probability를 입력으로 Softmax loss를 사용했으며, 전체 loss는 이 두 loss의 합을 이용했다.
  • SSD 이후 RefineNet, RetinaNet 등 주요 논문의 기초가 되었다.

SSD논문의 전체적인 이해를 할 수 있었고, 특히 Experiment 부분을 자세히 설명해주셔서 좋았습니다.
유익한 강의 감사합니다.

답글 달기
comment-user-thumbnail
2021년 5월 25일

투빅스 14기 장혜림

  • SSD는 one-stage detector로, region proposal과 detection이 한 번에 수행이 된다. 같은 계열인 YOLOv1과 비교했을 때 detection speed와 accuracy가 뛰어나며, multi-scale detection이 가능하다는 장점이 있다.
  • 또한 SSD는 single-shot learning으로 한 개의 이미지에 대해 한 번의 패스로 물체를 인식한다.
  • SSD는 다양한 크기의 객체를 탐지하기 위해 크기가 다른 feature map의 각 셀에 서로 다른 scale과 aspect ratio를 가진 여러 개의 default box를 사용하여 bounding box와 class를 예측한다.
  • multi-scale feature map을 통해 큰 feature map에서는 작은 물체를 검출하고, 작은 feature map에서는 큰 물체를 검출하여 정확도를 향상시켰다.
  • 이외에도 성능 향상을 위해 data augmentation, boundary box를 사용하였다.

속도와 정확도 모두를 향상시킨 모델이라는 점이 흥미로웠습니다. 유익한 강의 감사합니다!

답글 달기

투빅스 14기 서아라
이번 이미지 세미나 4주차 강의는 민거홍님께서 진행해주셨고, SSD 논문 리뷰를 해주셨습니다.

  • SSD는 CNN 기반의 One-Stage Detector 모델의 새로운 지평을 연 모델로, YOLO v1과 RCNN과 비교했을 때, detection speed와 accuracy 전반에서의 급격한 성능 향상이 있었다고 합니다.
  • 1-stage object detector 이란, region proposal과 detection이 한 번에 수행이 되는 detector로, 2-stage object detector에 비해 빠르지만 부정확하다는 특징이 있습니다.
  • 2-stage object detector 이란 region proposal후 detection이 순차적으로 진행이 되는 2-stage 모델로, 1-stage object detector에 비해 정확하지만 느리다는 특징이 있습니다.
  • single shot이란 한 개의 범주당 한 개의 서포드 데이터만 있는 문제를 의미합니다.
  • SSD는 기존 SOTA 모델들과 비교했을 때, SOTA single shot detector들보다 빨랐으며, mAP점수도 R-CNN과 동등하였다고 합니다.
  • SSD의 핵심은 default box들마다 cnn필터를 적용하여 범주 점수와 box offset을 예측하는 것입니다.
  • SSD는 이후 RefinaNet이나 RetinaNet의 만들게 되는 토대가 되었다고 합니다.

유명한 object detector model 중 하나인 SSD에 대하여 알 수 있었던 유익한 review였습니다! 감사합니다:)

답글 달기