💡 Object detection detectors (1 stage detector, 2 stage detector)
Overview
Backbone
- Feature extractors
- 다양한 level의 feature map 생성 (CNN architecture 중간 layers)
Neck
- Backbone과 head 사이를 이어주는 연결부
- Backbone의 서로 다른 stages에서 feature maps 추출
Head
- Bounding boxes의 classification & regression 검출 이루어지는 실질적인 부분
- Output: (x, y, h, w)과 k classes + 1(배경)의 확률
2-stage detector
1. Localization (후보 영역 찾기)
2. Classification 후보 영역에 대한 분류
- 1-stage object detector에 비해 비교적 느리지만 정확
1-stage detector
- Localization, Classification 이 동시에 진행
- 2-stage object detector에 비해 빠르지만 부정확하다
- 전체 이미지를 보기 때문에 객체에 대한 맥락적 이해가 높음
Summary
| 1 stage detector | 2 stage detector |
---|
| Localization, Classification 동시 진행 | Region proposal 과정 있음 |
Speed | High | Low |
Accuracy | Low | High |
Models | R-CNN SPPNet Fast R-CNN Faster R-CNN | YOLO v1, v2, v3 SSD RetinaNet |
참고