넷플릭스 프라이즈 요점 정리

Zero·2022년 7월 29일
0

추천 시스템

목록 보기
1/1
post-thumbnail

Netflix Prize?
→ 2006년 10월부터 2009년 7월까지 약 3년에 걸쳐 이어진 기계학습을 통한 영화 평가 데이터 예측 대회
‘collaborative filtering’, SVD를 활용한 SVD++는 이후 굉장히 많은 분야에서 활용

Cinematch 알고리즘보다 10% 이상 성능 향상이 대회의 주된 목표


영화 추천시스템 성능 평가 방법 : RMSE

  • RMSE
  • 실제값과 예측값의 차이를 제곱해 평균을 구한 후, 루트를 씌운 것

  • error를 최소화하는 방향으로 알고리즘이 예측 →RMSE 점수가 낮을수록 성능이 좋음
  • 한 유저가 ‘Forest Gump’에 별점을 4.0점을 줄 것이라 예상 → 실제로 3.7을 주었다고 함.
  • 추천 서비스를 제공하는데 최적화된 방법은 아님
    → 안 본 영화에 대한 별점을 예측하는 것보다는 어떤 영화를 가장 재미있게 볼지를 예측하는 것이 넷플릭스 프라이즈의 포인트였기 때문.

SVD (Singular Value Decomposition)

  • SVD
  • 대표적인 차원 축소 알고리즘.
  • 이미지나 텍스트에서 차원축소를 통해 잠재적인 의미를 찾아주는데 활용되고 있음.
  • Cinematch 알고리즘보다 5% 수준의 성능향상
  • 단일 알고리즘으로서 가장 좋은 성능을 보임
  • SVD는 선형대수에서 쓰이는 Matrix Factorization 기법 중 하나로 이미 유명
  • 하지만, 데이터에 알 수 없는 값들이 대부분인 경우 그대로 적용할 수 없음
  • 과적합(Overfitting)의 문제
  • Gradient Descent 방법을 통해 어떻게 SVD를 Netflix Prize 문제에 적합하게 SVD를 구현할 수 있는지 코드와 방법 공개
profile
코딩 일기

0개의 댓글