추론 ? -> 주변 단어(맥락)이 주어졌을 때 “?”에 무슨 단어(중심단어)가 들어가는지를 추측하는 작업
Word2Vec 정의
:단어간 유사도를 반영하여 단어를 벡터로 바꿔주는 임베딩 방법론
원-핫벡터 형태의 sparse matrix 이 가지는 단점을 해소하고자 저차원의 공간에 벡터로 매핑하는 것이 특징
Word2Vec은 “비슷한 위치에 등장하는 단어들은 비슷한 의미를 가진다“ 라는 가정을 통해서 학습을 진행
저차원에 학습된 단어의 의미를 분산하여 표현하기에 단어 간 유사도를 계산할 수 있음
알고리즘
CBOW: 주변에 있는 단어로 중간에 있는 단어들 예측
Skip-Gram: 중간에 있는 단어로 주변 단어들 예측
컨텐츠 기반 모델
장점
-협업필터링은 다른 사용자들의 평점이 필요한 반면에, 자신의 평점만을 가지고 추천시스템을 만들 수 있음
-item의 feature를 통해서 추천을 하기에 추천이 된 이유를 설명하기 용이함
-사용자가 평점을 매기지 않은 새로운 item이 들어올 경우에도 추천이 가능함
단점
-item의 feature을 추출해야 하고 이를 통해서 추천하기 때문에 제대로 feature을 추출하지 못하면 정확도가 낮아 분석 시 도메인 지식 필요할 수 있음
-기존의 item과 유사한 item 위주로만 추천하기에 새로운 장르의 item을 추천하기 어려움
-새로운 사용자에 대해서 충분한 평점이 쌓이기 전까지는 추천하기 힘듦