210812 EXPLORATION 9. 추천시스템

시에나 Sienna·2021년 8월 12일

AIFFEL

목록 보기

26/66

실습목표

아이디어의 단순함에도 불구하고 MF 모델은 성능이 준수하고 Scalability가 좋아서 많이 사용되는 모델
(m,n) 사이즈의 행렬 R을 (m,k) 사이즈의 행렬 P와 (k,n) 사이즈의 행렬 Q로 분해한다면 R이란 그저 P와 Q의 행렬곱으로 표현 가능할 수 있다는 아이디어
장점 : k는 m이나 n보다 훨씬 작은 값이기 때문에 계산량 측면으로도 훨씬 유리

m=4, n=5, k=2인 MF 모델
P와 Q의 내적 = R
- P의 Feature : 사용자의 특성(Feature) 벡터
- Q의 Feature : 영화의 특성 벡터
모델의 목표 : 모든 유저와 아이템에 대해 k-dimension의 벡터를 잘 만드는 것
평가 : 유저i의 벡터( $U_i$ )와 아이템j의 벡터( $I_j$ )를 내적했을 때 유저 $i$ 가 아이템 $j$ 에 대해 평가한 수치( $M_{ij}$ )와 비슷한지

<읽어보고 다시 이해해볼 것>
Scipy sparse matrix handling

csr_matrix((data, (row_ind, col_ind)), [shape=(M, N)])
data, row_ind그리고 col_ind관계 : a[row_ind[k], col_ind[k]] = data[k]