사용자/아이템 기반 협업 필터링 문제점
- 확장성 측면에서 큰 행렬 계산량
- 부족한 데이터 : 충분한 수의 리뷰가 없을 때
해결책 : 모델 기반 협업 필터링
- 행렬 분해방식(matrix factorization)
- 딥러닝방식 : 오토인코더
행렬 분해방식
- PCA(principal component analysis)
- SVD(singular vector decomposition
SVD, PCA 정리
PCA
- 차원을 축소하되 원래 의미는 최대한 그대로 간직
SVD
SVD++ : 넷플릭스 컨테스트에서 고안된 추천방식
- sparse행렬이 주어졌을 때 비어있는 셀들을 채우는 방법을 배우는 알고리즘
- 채워진 셀들의 값을 최대한 비슷하게 채우는 방식으로 학습
- 보통 RMSE의 값을 최소화하는 방식으로 학습하면서 SGD 사용