Definition
- Relative pose: 2개의 이미지 가 있을 때 은 에 대한 의 relative pose로 rotation , translation vector , translation scale 로 표현된다.
- Floor-wall boundary: 각 column별로 바닥과 벽이 맞닿는 영역에 대한 vertical angle 정보가 담긴 1D representation
- Co-visibility: 번째 column의 floor-wall boundary가 두 개의 파노라마 이미지에서 모두 존재하면 1, 그렇지 않으면 0인 binary value
- Angular Correspondence: 번째 column이 매칭되는 다른 파노라마 이미지에서의 horizontal angle
HorizonNet과 동일하게 ResNet50의 각 block에서의 output을 concat하여 columnwise feature 를 만든다.
Positional encoding과 learnable per-image segment embedding이 더해진 두 이미지의 feature 는 concat하여 transformer를 통과한다.
Transformer의 output 는 single FC layer로 구성된 CCF Decoder를 거쳐 를 출력한다.
또한, 6-layer 1-D CNN으로 구성된 Pose Decoder에서는 relative pose에 대한 5D vector를 출력한다.