[논문리뷰]Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks - 2015

안녕하쌉싸리와요·2023년 9월 6일
0
post-thumbnail

Preview

  • bottleneck에 해당하던 Region proposal 작업을 GPU 장치에서 수행(RPN적용)
  • end-to-end 학습
  • VGG16 으로 image의 특징을 추출 하고 Region Proposal Network(RPN)은 물체가 있을 법한 위치를 찾아 classifier에 전달하는데
    이는 기존의 Fast R-CNN의 구조를 따르면서 RPN의 proposals을 중심으로 classification/Regression을 진행할 수 있다.
  • 모두 GPU에서 이뤄지기 때문에 속도 + 성능 향상

RPN

  • feature map 에서 "물체가 있을 법한 위치를 예측"한다.
    • k 개의 서로 다른 anchor box를 사용함으로서 다양한 크기와 위치를 가지는 사물을 잘 예측할 수 있음
    • 본 논문에서는 anchor box의 비율을 1X1 ,1X2 ,2X1 ..으로 진행하지만 Regression을 통해 다양한 Bounding box로 예측을 수행한다.
    • sliding window 를 거쳐 각 위치에 대해서 intermediate layer를 통해 256-d의 feature extract로 회귀와 분류를 수행

여기서 RPN은 해당 위치에 물체가 존재하는가 안하는가의 여부만을 확인하기 위한 목적으로 classification layer 를 통해 여부와 알며 Regression layer 를 거쳐 Bbox의 x,y,w,h를 더욱 잘 예측 할 수 있다.
-> 실제 다양한 형태의 사물을 잘 예측하는 것을 알 수 있다.

profile
무니의 성장스토리 😣

0개의 댓글