- Point cloud의 다양한 pose에서의 color histogram과 query image의 color histogram을 비교한다.
- 두 histogram의 consistency value를 2D score map 과 3D score map 로 기록한다.
- Score map을 통해 선택한 Candidate poses를 refine한 후 최적의 pose를 찾는다.
- 개의 3D location을 골라 개의 synthetic view를 rendering 한다.
- 개의 pose 중 histogram intersection이 가장 큰 개의 candidate pose를 찾는다. Rotation은 uniform하게 sampling하며 rendering한 single view로부터 patch-wise histogram을 얻는다.
Scene과 lighting에 변화가 있는 OmniScenes와 Structured3D에 대해 좋은 성능을 보이고 있다.
2D, 3D score map을 visualize 한 결과 scene change가 존재하는 영역의 score가 낮게 나타나는 것을 확인할 수 있다.
Scene change가 없는 경우에도 SOTA를 찍었으며 semantic input에 대해서도 성능이 좋다.