Node feature
vi=[fp(Pi),σi,ln(bi),ln(vi)ln(li)]
fp(Pi): Point cloud Pi가 PointNet을 거쳐 인코딩된 latent feature
σi: Segment 내 포인트들의 위치의 표준편차
ln(bi): bounding box size의 log값
ln(vi): bounding box의 부피의 log값. vi=bx⋅by⋅bz
ln(ln): bounding box의 최대 길이의 log값. ln=max(bx,by,bz)
Edge feature
rij=[pi−pj,σi−σj,bi−bj,ln(ljli),ln(νjνi)],
eij=gs(rij)
piˉ: segment의 중심점
gs: paired segment properties를 latent space로 보내는 MLP
GNN feature
노드와 엣지의 feature는 2개의 message passing layer를 거치는 GNN을 통과하여 neighborhood 정보를 포함시킨 강화된 feature를 뽑아낸다.
viℓ+1=gv([viℓ,maxj∈N(i)(FAN(viℓ,eijℓ,vjℓ))]),
eijℓ+1=ge([viℓ,eijℓ,vjℓ])
N(i): 노드 i의 이웃 노드들의 인덱스 집합
gv(⋅),ge(⋅): MLP
FAN(vi,eij,vj)=MFAT([g^q(vi),g^e(eij)],g^τ(vj))
- feature-wise attention network
- Multi head를 사용하며 target node의 feature를 통해 attention을 학습한다.
- gq^(⋅),ge^(⋅),gτ^(⋅): vi,eij,vj를 2dq,2dq,dτ차원으로 맵핑하는 단일 퍼셉트론