1. 데이터 준비와 전처리
(1) ratings 3 미만 데이터 제거
(2) ratings 컬럼 이름 counts로 변경
(3) 영화 제목을 보기 위해 메타 데이터를 읽어오기
2. 데이터 분석
(1) ratings에 있는 유니크한 영화 개수
(2) ratings에 있는 유니크한 사용자 수
(3) 가장 인기 있는 영화 30개(인기순)
3. 선호하는 영화 ratings에 추가
(1) 사용하는 컬럼만 남기기
(2) 고유한 유저, 아티스트를 찾기
(3) 유저, 아티스트 indexing
(4) indexing을 통해 데이터 컬럼 내 값 변경
4. CSR matrix 생성
5. als_model = AlternatingLeastSquares 모델 훈련
6. 훈련된 모델이 예측한 선호도를 파악하기
7. 내가 좋아하는 영화와 비슷한 영화를 추천받기
8. 내가 좋아하는 영화와 비슷한 영화를 추천받기
모델 훈련 후 비슷한 영화를 추천받거나, 좋아할만한 영화를 추천받았을 때 내가 입력한 영화들만 도출되는 오류 발생
입력한 5개의 영화가 모두 디즈니 애니메이션이라는 같은 범주에 속해있긴 하지만, Toy story, lion king 등 다른 애니메이션을 추천해줄 수 있는데 내가 선호한다고 명시한 영화들만 다시 추천됨