paper
: Feature Pyramid Networks for Object Detectionauthor
: Tsung-Yi Lin, Piotr Dollár, Ross Girshick, Kaiming He, Bharath Hariharan, Serge Belongiesubject
: 2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR)Feature pyramids는 다양한 scale에 대해 object를 detecting하는 recognition system의 basic component임.
하지만 compute and memory intensive이기 때문에
최근 deep learning object detector들은 pyramid representation을 쓰지 않음.
이 논문에서는 multi-scale에 좋은 deep conv network의 pyramidal hierarchy를 소개할 것이다.
Feature Pyramid Network (FPN)
이라고 부름.(a)
:featurized image pyramids
)는(b)
:ConvNets
)도 variance에 robust하고,(c)
:featurizing each level of an image pyramid
의 주요 이점으로는image pyramids
는 multi-scale feature representation을 계산하기 위한 방법으로만 사용되지 않는다.(d)
:Feature Pyramid Network(FPN)
이라고 부른다.Several other approahces(HyperNet, ParseNet, ION ....) concatenate features of multiple layers before computing predictions
There are recent methods exploiting lateral/skip connections that associate low-level feature maps across resolutions and semantic levels, including U-Net [31] and Sharp- Mask [28] for segmentation, Recombinator networks [17] for face detection, and Stacked Hourglass networks [26] for keypoint estimation.....
우리의 목표는 ConvNet의 pyramidal feature hierarchy를 활용하여,
low level부터 high level까지 semantics(의미론적 특징)을 갖추고 있는 feature pyramid를 만드는 것이다.
우리의 Feature Pyramid Network는 arbitrary(임의의) size의 single-scale image를 convolutional network에 입력하여,
multiple levels에 적절하게 size된 feature maps을 출력하는 network이다.
이 process는 backbone convolutional architecture에 독립적이다.
그리고 이 논문에서는 ResNet을 사용했다.
FPN 구조는 bottom-up pathway
, top-down pathway
, lateral connections
로 구성되었다.
bottom-up pathway
는 backbone ConvNet의 feedforward computation이고,stage
.our reference set of feature maps
, which we will enrich to create our pyramid.the feature activation output by each stage's last residual block.
top-down pathway
는 공간적으로 coarser(굵다)하지만,lateral conection
으로 인해