시리즈

추천시스템 Recommendation System

1.기본적인 추천 시스템(best-seller 방식)

인기제품 방식 (Best-Seller) > 개별 사용자 정보가 없고, 간단한 추천을 제공해야할 때, 모든 사용자에게 가장 인기 있는 동일한 상품에 대해서 추천을 한다. 사용자 정보가 없을 때 추천해줄 수 있는 방법이다. = 각 제품에 대한 평가의 평균을 구해서 1등

2024년 1월 11일

2.사용자 집단별 추천

사용자 집단별 추천 > best-seller 방식은 전체 사용자의 평점평균을 사용하기 때문에 집단간의 평가 경향이 있다고 가정한다면, 예측값에 대해서 노이즈값이 많이 낀다고 볼 수 있다. 따라서ㅋㅋ Gender 기준 추천 기존에는 movie_id로 groupby 했

2024년 1월 11일

3.협업필터링 Collaborative Filtering CF

어떤 아이템에 대해 비슷한 취향을 가진 사람들은 다른 아이템 또한 비슷한 취향을 가질 것이다.사용자 집단별 추천과 같이 인구통계학적 변수를 기준으로 나누는 것이 아니라 취향을 고려해서 추천하자!협업 필터링은 취향이 비슷한 사람들이 존재할 것이라고 가정하고,집단을 특정해

2024년 1월 11일

4.사용자의 평가 경향을 고려한 CF

최적의 이웃을 구한 후, 보다 더 CF를 개선시키기 위해 사용자의 평가 경향을 고려한 CF 알고리즘을 짜본다.각 사용자의 평점 평균을 구한다.각 평점에서 위에서 구한 각 사용자의 평균을 뺀다.(‘평점’ - ‘평점 평균’ = '평점편차' )평점 편차 임시 예측값 계산 실

2024년 1월 12일

5.그 외의 CF 정확도 개선 방법

추천 받을 사용자와 유사도가 같은 사용자 2명이 있다고 가정할 때, 각각의 공통 평가 아이템의 개수에 따라서 신뢰도의 차이가 있다. \-> 따라서 사용자 간 유사도를 측정할 때 신뢰도를 가중하자!하지만, 예측값은 매우 민감하기 때문에 약간의 계산식을 바꿔도가 RMSE값

2024년 1월 12일

6.사용자 기반 CF와 아이템 기반 CF

사용자 기반 CF > 사용자 A와 취향이 비슷한 다른 사용자를 찾고, 두 사용자의 차이점을 서로에게 추천한다. 사용자 A와 유사도 측정을 한 후, 유사한 사용자를 찾지 못한다면 추천해줄 수 없는 단점이 있다. 아이템 기반 CF 기준이 되는 아이템을 제외한 다른 아이템

2024년 1월 12일

7.추천 시스템의 성과측정지표

추천 시스템의 성과 측정 지표 > 데이터를 train set과 test set으로 분리 train set을 사용해서 학습하고, test set으로 평가 예상 평점과 실제 평점 차이를 계산 후 정확도 측정 그렇지만, 정확도라는 것이 train set과 test set에

2024년 1월 12일

8.MF Matrix Factorization 기반 추천

추천을 위한 다양한 알고리즘 종류 메모리 기반 알고리즘 > 추천을 위한 데이터를 모두 메모리에 가지고 있으면서 추천이 필요할 때마다 데이터를 사용하고 계산해서 추천하는 방식 장점: 모든 데이터를 메모리에 저장하고 있기 때문에 원래 데이터에 충실하게 사용한다. 단점:

2024년 1월 19일

9.SGD(Stochastic Gradient Descent)를 사용한 MF 알고리즘-1

MF 원리 복습 어떤 도메인에 대해서 사용자와 아이템을 잘 설명할 수 있는 k개의 잠재요인이 있고, 각 사용자와 아이템의 P, Q 행렬을 알아낼 수 있다면, 모든 사용자의 모든 아이템에 대한 예측 평점(R hat)을 구할 수 있다. > 핵심: 주어진 사용자와 아이템

2024년 1월 20일

10.SGD(Stochastic Gradient Descent)를 사용한 MF 알고리즘-2

이번에는 sklearn의 traintestsplit을 사용하지 않고, shuffle을 사용한다. traintestsplit() > traintestsplit의 경우에는 층화추출법을 사용하여 분리했는데, 이 경우 train set의 정답값이 불균형하게 들어가있어도 비율

2024년 1월 23일

11.MF_최적의 파라미터 찾기

MF 최적의 파라미터 찾기 최적의 k와 iteration 값을 찾아 과적합을 방지한다. > 10씩 k값을 조정해나가면서 RMSE값을 계산해 대략적인 최적의 k값을 찾은 후, 대략적인 최적의 k값에서 전후로 1씩 조정해나가며 최적의 k값을 찾는다. 최적의 k값을 고정

2024년 1월 24일

12.MF와 SVD

데이터 분석과 기계학습에서 많이 사용되는 MF와 SVD 개념을 헷갈려하는 사람들이 많다고 한다. 그렇지만 명백히 다른 기법이라고 한다.반면, MF의 경우 2개의 행렬로 분해하고, k개의 잠재요인을 사용해서 표현된다.null값을 0의 값으로 표현했고, P 행렬과 Q 행렬

2024년 1월 25일

추천시스템 Recommendation System

1.기본적인 추천 시스템(best-seller 방식)

2.사용자 집단별 추천

3.협업필터링 Collaborative Filtering CF

4.사용자의 평가 경향을 고려한 CF

5.그 외의 CF 정확도 개선 방법

6.사용자 기반 CF와 아이템 기반 CF

7.추천 시스템의 성과측정지표

8.MF Matrix Factorization 기반 추천

9.SGD(Stochastic Gradient Descent)를 사용한 MF 알고리즘-1

10.SGD(Stochastic Gradient Descent)를 사용한 MF 알고리즘-2

11.MF_최적의 파라미터 찾기

12.MF와 SVD

13.Surprise 패키지 사용

14.keras로 MF 구현하기

15.딥러닝을 이용한 추천 시스템

16.딥러닝 모델에 다양한 변수 활용하기

17.하이브리드 추천 시스템

18.대규모 데이터 처리를 위한 Sparse Matrix 사용

19.추천시스템 이슈 사항