[Point Review] SceneGraphNet: Neural Message Passing for 3D Indoor Scene Augmentation
Contribution
- 3D scene에서 location query가 주어졌을 때 적절한 객체의 type에 대한 예측을 하는 task
- Shape과 context에 대한 정보를 message passing하여 objec type에 대한 확률분포를 추정
Methods
- 각 노드에는 category, position, scale에 대한 정보가 담겨있다.
- 노드의 정보를 MLP를 통해 다른 노드로 전달하며 message의 중요도에 따라 가중치를 부여한다(attention mechanism)
- 여러 노드들로부터 모은 정보들은 GRU 모듈을 통해 aggregation한다.
- edge에는 "supporting, supported-by, next-to" 등과 같은 relation에 대한 정보를 담는다.
- Training: 랜덤하게 object를 제거하여 제거된 노드의 category를 정확히 예측하도록 학습한다.
- Test: position을 주고 category와 size에 대해서는 초기화를 한 빈 노드를 생성 후 node classification을 한다.
Results
Reference