Preview
- bottleneck에 해당하던 Region proposal 작업을 GPU 장치에서 수행(RPN적용)
- end-to-end 학습
- VGG16 으로 image의 특징을 추출 하고 Region Proposal Network(RPN)은 물체가 있을 법한 위치를 찾아 classifier에 전달하는데
이는 기존의 Fast R-CNN의 구조를 따르면서 RPN의 proposals을 중심으로 classification/Regression을 진행할 수 있다.
- 모두 GPU에서 이뤄지기 때문에 속도 + 성능 향상
RPN
- feature map 에서 "물체가 있을 법한 위치를 예측"한다.
- k 개의 서로 다른 anchor box를 사용함으로서 다양한 크기와 위치를 가지는 사물을 잘 예측할 수 있음
- 본 논문에서는 anchor box의 비율을 1X1 ,1X2 ,2X1 ..으로 진행하지만 Regression을 통해 다양한 Bounding box로 예측을 수행한다.
- sliding window 를 거쳐 각 위치에 대해서 intermediate layer를 통해 256-d의 feature extract로 회귀와 분류를 수행
여기서 RPN은 해당 위치에 물체가 존재하는가 안하는가의 여부만을 확인하기 위한 목적으로 classification layer 를 통해 여부와 알며 Regression layer 를 거쳐 Bbox의 x,y,w,h를 더욱 잘 예측 할 수 있다.
-> 실제 다양한 형태의 사물을 잘 예측하는 것을 알 수 있다.