[TIL] 20210304_SVD , PCA

이석영·2021년 3월 4일

사용자/아이템 기반 협업 필터링 문제점

  • 확장성 측면에서 큰 행렬 계산량
  • 부족한 데이터 : 충분한 수의 리뷰가 없을 때

해결책 : 모델 기반 협업 필터링

  • 행렬 분해방식(matrix factorization)
  • 딥러닝방식 : 오토인코더

행렬 분해방식

  • PCA(principal component analysis)
  • SVD(singular vector decomposition
    SVD, PCA 정리

PCA

  • 차원을 축소하되 원래 의미는 최대한 그대로 간직

SVD

  • 2개 혹은 3개의 작은 행렬의 곱으로 단순화

SVD++ : 넷플릭스 컨테스트에서 고안된 추천방식

  • sparse행렬이 주어졌을 때 비어있는 셀들을 채우는 방법을 배우는 알고리즘
  • 채워진 셀들의 값을 최대한 비슷하게 채우는 방식으로 학습
  • 보통 RMSE의 값을 최소화하는 방식으로 학습하면서 SGD 사용
profile
원하는 대로 살자

0개의 댓글