Preview
R-CNN 과 동일한 Region proposal을 이용하지만 이미지를 한 번만 CNN에 넣어 feautre Map을 생성한다.
- RoI(Region of Interest) projection
- CNN을 거친 feature map에서는 원본 image의 위치정보를 포함하고 이러한 feature map으로 RoI projection을 통해 object 가 존재할 법한 위치를 feature map 상에서 예측한다.
- RoI pooling 을 통해 필요한 정보만을 추출하고 FCN
- 분류를 위해 FCN를 사용하는 데, FCN의 input으로 고정된 크기의 vector를 생성해야한다.
- 이때 RoI 영역에 대하여 Max pooling을 사용한다.
- Max pooling 은 특정 영역의 가장 큰 값만 선택하여 고정된 크기의 feature vector 를 얻을 수 있음
- 단점: Selective search로 여전히 Region proposal을 하기 때문에 CPU를 사용하기에 속도가 느리게 동작하는 bottleneck 존재한다.