추천시스템 논문 리뷰

기린이·2021년 1월 2일
0

오늘 읽어볼 논문은
"A Deep Temporal Neural Music Recommendation Model Utilizing Music and User Metadata"

논문을 요약하자면
dnn을 이용해서 음원 메타데이터와 유저의 청취기록과 메타데이터의 feature를 뽑고 이를 합해서 최종적인 rating value를 내는 과정이다.


모델을 한눈에 볼 수 있는 그림이다.


Music Feature Component


음원의 메타데이터를 원핫인코딩하고 concatenate한다. -> M(s)
이를 DNN에 통과시킨다 -> S(s)


User Preference Component


유저에 대한 부분은 유저의 변하지 않는 고유의 특징을 파악하는 user static 부분 -> US(u)
유저가 곡을 들을 때 마다 변하는 특징인 user dynamic 부분 -> UD(u)
로 구성된다. 이들을 합치는 방법은 위 그림의 아래 부분으로 3가지이고 이후 세가지 방법의 성능을 비교한다.


User Intrinsic Component


US(u)에 대한 설명이다.
유저의 메타데이터와 들어왔던 음악의 임베딩값들을 더한 값을 concatenate한다.


User Dynamic Component


RNN의 각 time slot에 들어가는 값은 해당 시간에 들은 음악->S(s), 듣게된 행동 패턴 -> B(u, t) 이다.
이를 short term, long term 관점에서 구성하고 합쳐서 최종적인
UD(U)를 완성한다.


Rating and Training


최종적인 rating value가 나오는 과정이다.
학습되는 값인 w와 b와 U(u,t), S(s)의 선형결합이다. 이 값이 높은 상위 k개의 아이템 추천한다.

cost function은 위 슬라이드의 아래쪽에 위치한다.


Experiments


주황색으로 주쳐진 요소들을 넣고 빼보면서 가장 성능이 좋은 결합을 봤더니 모든 요소를 넣었을 때 성능이 가장 좋았다.


다른 추천시스템 방법들과 비교했을 때 해당 방법이 가장 성능이 좋았다고 한다.

개인적으로 음원 메타데이터랑 유저 메타데이터를 one hot encoding해서 concatenaete하는데 너무 sparse해지고 차원이 너무 커지지 않을까하는 의문이 든다.

카카오 아레나 대회 이후 추천시스템에 관심을 계속 두고 있었는데 추천시스템관련 플젝할 기회가 생겨서 다음은 ACM RecSys challenge 2018 관련 논문을 읽어볼 예정이다.

profile
중요한 것은 속력이 아니라 방향성

0개의 댓글