1. Word2Vec
(1) 개요
(2) 학습 방법2. Item2Vec
(1) 개요
(2) 학습 과정3. Approximate Nearest Neighbor (ANN)
(1) 개요
(2) 학습 방법
(1) 개요
(2) 학습 과정
학습 데이터 생성 : 유저 혹은 세션별로 소비한 아이템의 집합과 그 집합의 아이템 (집합의 아이템끼리는 서로 유사하다고 가정)
Nearest Neightbor (NN) : 주어진 vector space에서 원하는 query vector와 가장 유사한 vector를 찾는 알고리즘
추천 모델 서빙 -> Nearest Neighbor Search : 주어진 query vector의 가장 인접한 이웃을 찾아주는 것
ANNOY (ANN의 라이브러리) : 주어진 벡터들을 여러 개의 부분집합으로 나누고 트리 형태로 구성해서 효율적인 탐색을 함
임의의 두 벡터를 선택하여 그 사이의 hyperplane으로 공간을 나눠 부분집합을 만든다.
부분집합에 있는 벡터의 개수를 노드로 해서 binary tree를 생성한다.
부분집합의 점이 K개를 초과한다면 해당 집합에서 또 공간을 나누고 트리를 생성한다.