기존 CF 알고리즘은 아이템과 아이템 간의 similarity를 생상해내는 기법
Skip-gram with Negative Sampling(SGNS)이의 도입으로 NLP 분야의 괄목할만한 성장을 보임
Item에 이를 적용해보면 어떨까?
유저의 정보가 없는 상황에서도 아이템 간 추천이 가능
Item-based CF에 SGNS를 적용하는 새로운 기법인 item2vec
word2vec의 skip-gram 방법론에서 Negative sampling을 추가한 것
기존 skip-gram 방법은 계산 복잡도가 증가하여 실용적이지 못함
SGNS는 주변 단어와 중심 단어가 모두 입력이 되고, 두 단어가 실제로 윈도우 크기 내에 존재하는지 확률을 예측
랜덤으로 주변 단어가 아닌 단어를 가져와 label 을 0 으로 해서 나머지 embedding을 수행하는 방식이 SGNS
words의 sequence를 item의 set과 동일하게 봄
같은 set에 존재하는 item은 시간에 관계 없이 유사하다고 간주
같은 set 안에 존재하는 item 쌍을 positive example로
기존 SGNS와 다른 점은, window size를 설정하는 것이 아닌 sequence 내부의 모든 아이템을 탐색