- 이번에는 잠재 인수 모형(Latent Factor Model)에 대해 배운다
- 혹시, "넷플릭스"를 사용해본적이 있는가? 사용해보았다면, 넷플릭스가 사용자에게 언제부터 어떻게 미디어 콘텐츠를 '잘' 추천할 수 있게 됐는지 궁금하지 않으가? 이번에는 이와 관련한 대회인 "넷플릭스 챌린지"에 대해 소개한다
- 또, 지난번에 배웠던 협업필터링의 방법 이외에 추천의 새로운 방법, 잠재 인수 모형을 활용한 추천 시스템에 대하여 소개한다
- 특정 차원에서 단어를 벡터 하나로 나타내는 것처럼, 추천시스템에서의 사용자와 아이템도 벡터 하나로 표현할 수 있을까?
- 또, 이 벡터를 어떻게 학습시킬까? 이에 대한 해답들을 배운다
사용자와 상품을 임베딩하는 기준은 무엇인가?
행렬 차원에서 살펴보자
잠재 인수 모형은 다음 손실 함수를 최소화하는 와 를 찾는 것을 목표로한다
과적합을 방지하기 위하여 정규화 항을 손실 함수에 더해준다
정규화는 극단적인, 즉 절댓값이 너무 큰 임베딩을 방지하는 효과가 있다
각 사용자의 편향 은 해당 사용자의 평점 평균과 전체 평점 평균의 차 이다
각 상품의 편향 은 해당 상품에 대한 평점 평균과 전체 평점 평균의 차 이다
개선된 잠재 인수 모형에서는 평점을 전체 평균, 사용자 편향, 상품 편향, 상호작용 으로 분리한다
넷플릭스 시스템의 변화로 평균 평점이 크게 상승하는 사건이 있었다
영화의 평점은 출시일 이후 시간이 지남에 따라 상승하는 경향을 갖는다
개선된 잠재 인수 모형에서는 이러한 시간적 편향을 고려한다