sparse한 데이터가 rating prediction의 정확도를 떨어뜨리기 때문에 다양한 정보를 추가적으로 활용하고자하는 노력
기존에 CNN을 추천에 쓴 경우는 music recommendation에서 acoustic signals processing을 다뤘던 것 밖에는 없고, 본 논문에서는 item description, 즉 document에 CNN을 적용해서 추천체 적용하고자하는 시도!
U, W는 spherical Gaussian prior이고 v는 convolution 결과와 noise (epsilon) 합쳐진 형태
그런데 왜 v에 noise가 필요할까???
Embedding Layer
item의 document를 word 단위로 임베딩 (학습된 word vector 사용하거나 random initialize)
Convolution Layer
deeper understanding of documents helps adjust latent models more accurately even when enough ratings are given
2)
dataset이 dense해질수록 ConvMF와 ConvMF+의 성능 차이가 적어짐. 이 말은 ConvMF의 CNN이 PMF에 잘 통합되었다.
3) ConvMF vs ConvMF+
dataset이 sparse할수록 pretrained word embedding이 모델의 성능을 향상시킴
심지어는 충분한 데이터양이 있으면 오히려 성능을 저하시킥
결국엔 content정보를 어떤식으로 활용해서 모델에 넣어야할지를 고민해야할듯!