SPP (Spatial Pyramid Pooling) Net

개발일기장기일·2024년 5월 27일

딥러닝컴뷰터비전

목록 보기
5/8

RCNN 주요 문제점


  • 2000개의 Region 영역 이미지가 CNN으로 입력되면서 Object Detection 수행시간이 오래 걸림
  • Region 영역 이미지가 Crop/Warp 되어야 함

RCNN 개선 방안


2000개의 Region Proposal 이미지를 CNN으로 Feature Extraction하지 않고 원본 이미지만 CNN으로 Feature Map 생성 뒤에 원본 이미지의 Selective Search로 추천된 영역의 이미지만 Feature Map으로 매핑하여 별도 도출

  • RCNN 수행시간 개선 방안 문제점
    : CNN은 서로 다른 사이즈의 image를 수용하지 않는데, Flatten Fully Connection Input의 크기가 고정이 되어야 하기 때문임

서로 다른 크기의 Region Proposal 이미지 개선 방안


Feature map으로 투영된 서로 다른 크기를 가진 Region Proposal 이미지를 SPP Net의 크기 vector로 변환하여 FC에 1D Flattended 된 input 제공

SPP (Spatial pyramid Pooling)


CNN Image classification에서 서로 다른 이미지의 크기를 고정된 크기로 변환하는 기법

SPP는 Spatial Pyramid Matching 기법에 근간을 둠

Spatial Pyramid Matching


  • Bag of Visual words

문제점: 매핑정보를 histogram화 하면 object의 위치가 중요한 경우
-> 이미지를 분할해서 histogram화

SPM으로 서로 다른 크기의 Feature Map을 균일한 크기의 Vector 표현



SPM으로 서로 다른 크기의 Feature Map을 균일한 크기의 vector 표현
어차피 분면으로 나누기 때문에 feature map의 크기와 상관이 없음

Spatial Pyramid Pooling


SPP-Net - Image Classification


SPP-Net - Object Detection


SPP Net RCNN 적용


R-CNN과 SPP-Net 비교


profile
안녕하세요 개발일기장입니다

0개의 댓글