Region Proposal 방식에 기반한 Object Detection

R-CNN 모델의 Classification Dense layer로 인해 이미지 크기 동일
Region Proposal 수행한 후 도출된 이미지 하나하나에 CNN 연산 적용

RCNN Training - Classification

- 원본 이미지에 Selective Search 적용
- ImageNet으로 Feature Extractor pre-train 시킴
- Ground Truth와 SS Predicted 된 영역 IOU가 0.5 이상인 경우만 해당 클래스로, 나머지는 background로 fine-tuning
- Ground Truth로만 학습하되 0.3 IOU 이하는 background로 설정. 0.3 이상이지만 GT가 아닌 경우는 무시
Bounding Box Regression

RCNN 장단점
장점: 높은 detection 정확도
단점: 너무 느린 detection 시간 & 복잡함
하나의 이미지마다 selective search 수행해서 2000개의 region 영역 이미지 도출
개별 이미지 별로 2000개씩 생성된 region 이미지를 CNN Feature map 생성
각자 따로 노는 구성 요소들 Selective Search, CNN Feature Extractor, SVM과 Bounding Box Regressor로 구성되어 복잡한 프로세스를 거쳐서 학습 및 Object Detection이 되어야 함.
RCNN 이후 Object Detection 연구 방향성
- Deep Learning 기반 Object Detection 성능 입증
- Region Proposal 기반 성능 입증
- Detection 수행 시간을 줄이고 복잡하게 분리된 개별 아키텍처를 통합할 수 있는 방안 연구 매진
👍👍👍👍👍