[TIL] Item2Vec: Neural Item Embedding for Collaborative Filtering (2016)

박상우·2023년 1월 9일
0

TIL

목록 보기
4/12
post-thumbnail

Introduction

기존 CF 알고리즘은 아이템과 아이템 간의 similarity를 생상해내는 기법
Skip-gram with Negative Sampling(SGNS)이의 도입으로 NLP 분야의 괄목할만한 성장을 보임
Item에 이를 적용해보면 어떨까?
유저의 정보가 없는 상황에서도 아이템 간 추천이 가능

  • 아이템의 개수보다 유저의 수가 훨씬 많은 대용량 데이터셋의 경우, 유저와 아이템 간 관계를 동시에 구하게 되면 계산복잡도는 기하급수적으로 증가 (음악 사이트, 유저가 특정되지 않는 session 정보)
  • 유저에 대한 사전정보가 없어도 광고할 수 있음

Item-based CF에 SGNS를 적용하는 새로운 기법인 item2vec

SGNS

word2vec의 skip-gram 방법론에서 Negative sampling을 추가한 것

  • 기존 skip-gram 방법은 계산 복잡도가 증가하여 실용적이지 못함

  • SGNS는 주변 단어와 중심 단어가 모두 입력이 되고, 두 단어가 실제로 윈도우 크기 내에 존재하는지 확률을 예측

  • 랜덤으로 주변 단어가 아닌 단어를 가져와 label 을 0 으로 해서 나머지 embedding을 수행하는 방식이 SGNS

Item2Vec - SGNS for item similarity

words의 sequence를 item의 set과 동일하게 봄
같은 set에 존재하는 item은 시간에 관계 없이 유사하다고 간주
같은 set 안에 존재하는 item 쌍을 positive example로

기존 SGNS와 다른 점은, window size를 설정하는 것이 아닌 sequence 내부의 모든 아이템을 탐색

profile
세상아 덤벼라

0개의 댓글