[딥러닝] SSD (single shot detection)

김영민·2022년 10월 6일
0

DeepLearning

목록 보기
25/33
모든 이미지의 출처는 인프런 : 컴퓨터 비전 완벽 가이드 에 있으며, 공부 기록용으로 블로그를 작성하는 것입니다.

SSD

수행 속도와 성능이 이전보다 훨씬 좋아진 모델입니다.

  • SSD의 주요 구성 요소 : Multi Scale Feature Layer + Anchor Box

Multi Scale Feature Layer

핵심

서로 다른 크기의 Feature Map들을 기반으로 Object Detection 수행하는 것.
Feature Map의 크기가 작을수록 더 큰 이미지를 찾을 수 있습니다.

anchor box를 활용하여 Object Detection

  • anchor box와 겹치는 feature map 영역의 object 클래스 분류
  • GT box 위치를 예측할 수 있도록 수정된 좌표

개별 anchor box가 갖고 있는 정보는
1. Detection하려는 object 유형의 softmax 값
2. 수정된 anchor box 좌표값

SSD Network

  • 받는 원본 이미지 : 300X300 or 512X512
  • 개별 셀의 anchor box 개수 : 4개
  • anchor box가 가지고 있는 정보 : Classes(객체 개수, pascal20이라고 하면 20 + 1(배경) ) + 4(좌표)
  • Feature map 별로 anchor box를 가지고 와서 Detections로 모아놓고, NMS를 통해 객체 인식 (아래 그림 참조)

0개의 댓글