Contribution
Geometric variation(기하학적 변형)에 대한 인식을 잘 하기 위해 data augmentation을 활용하거나 SIFT와 같은 transformation-invariant 알고리즘을 활용할 수 있으나 한계가 있다.
-> offset을 학습하여 flexible한 필터를 만들자.
Method
- pn은 offset으로 상하좌우, 대각선으로 1씩 이동하게 만든는 parameter이다.
- 본 연구에서는 소수점 단위로도 움직일 수 있도록 Δpn를 도입하였다.
- Δpn은 bilinear interpolation을 통해 계산한다.
- RoI Pooling에도 동일한 방식을 적용하며 fc layer를 통과시킨다.
Results
- Deformable convolution을 활용하면 receptive field가 고정된 사각형 형태를 벗어나 불필요한 부분은 제외하고 객체에 더욱 초점을 맞출 수 있음을 확인할 수 있다.
- RoI 또한 3x3의 필터가 유연하게 적용되고 있다.
Reference