Remind : ML Framework
Remind : AlexNet
Remind : 1x1 Convolution
Remind :Depthwise Seperable Convolution
RCNN과 같이 region proposal 과정을 거치지 않고 1-stage로 모델 진행
저해상도에서 잘 되어서, 낮은 resolution의 input을 받음
+4 : x, y, w, h
Layerwise하게 나오는 response (feature map)을 모두 feature extraction으로 활용
Multi-scale feature maps for detection
OverView
Detail
5x5x256의 object detection 과정을 보면
먼저, 5x5x6개의 default box를 generate
Default box는 비율과 크기가 각기 다른 기본 박스를 먼저 설정해 놓아서 Bounding Box를 추론하는데 도움을 주는 장치
SSD는 각각의 피쳐맵을 가져와서 비율과 크기가 각기 다른 Default Box를 투영
Default box와 ground truth 간의 겹치는 정도(IoU가 높은 것을 뽑음)
이후 걸러진 default box에 대하여 predicted bounding box와 매칭을 하고 loss를 계산