[ConvMF]Convolutional Matrix Factorization for Document Context-Aware Recommendation

sherry·2024년 2월 1일

1. INTRODUCTION

sparse한 데이터가 rating prediction의 정확도를 떨어뜨리기 때문에 다양한 정보를 추가적으로 활용하고자하는 노력

2. PRELIMINARY

기존에 CNN을 추천에 쓴 경우는 music recommendation에서 acoustic signals processing을 다뤘던 것 밖에는 없고, 본 논문에서는 item description, 즉 document에 CNN을 적용해서 추천체 적용하고자하는 시도!

3. CONVOLUTIONAL MATRIX FACTORIZATION

3.1 Probabilistic Model of ConvMF

U, W는 spherical Gaussian prior이고 v는 convolution 결과와 noise (epsilon) 합쳐진 형태
그런데 왜 v에 noise가 필요할까???

3.2 CNN Architecture of ConvMF

Embedding Layer
item의 document를 word 단위로 임베딩 (학습된 word vector 사용하거나 random initialize)
Convolution Layer

4.2 Experimental Results

deeper understanding of documents helps adjust latent models more accurately even when enough ratings are given

2)
dataset이 dense해질수록 ConvMF와 ConvMF+의 성능 차이가 적어짐. 이 말은 ConvMF의 CNN이 PMF에 잘 통합되었다.
3) ConvMF vs ConvMF+
dataset이 sparse할수록 pretrained word embedding이 모델의 성능을 향상시킴
심지어는 충분한 데이터양이 있으면 오히려 성능을 저하시킥

궁금한 점

  1. 왜 v에 noise를 넣는지 (리뷰데이터 경우에는 넣는게 맞는 것 같은데 movie lens 데이터셋에서 IMDB document에도 노이즈가 있남??)
  2. 콘텐츠 정보를 아예 안쓴 PMF랑 CTR의 성능이 차이가 별로 안나는 점,,
    이게 4.2의 1) 마지막 분단 부분에도 있는데 do not reside in the same latent space가 무슨 의미인지,,??

결국엔 content정보를 어떤식으로 활용해서 모델에 넣어야할지를 고민해야할듯!

profile
Es muss sein!

0개의 댓글