회고
오늘은 뭔가 pandas에 대해 더 알게된 하루인 것 같다...
오늘의 학습 리스트
- collaborative filtering
- '이 상품을 구매한 사람이 어떤 상품도 구매했습니다'
- 위의 논리에 의한 추천은 따로 해석할 필요 없음
- 행렬 분해나 KNN(K 최근접 이웃 알고리즘)을 사용한단다.
pd.Series.str
pd.Series.nunique()
- 해당 컬럼(시리즈)의 유니크한 데이터 개수 반환
pd.DataFrame.isin()
- like-like value를 넣는데, 그게 df에 있는지 boolean df로 반환해준다.
pd.DataFrame.appen(df)
- DataFrame도 append 가능하다...
pd.Series.map()
- Used for substituting each value in a Series with another value, that may be derived from a function, a dict or a Series.
- implicit feedback
- 여러 작은 스타트업에서 이커머스 관련 일도 해보면서 많이 고민했었다.
미니프로젝트
영화 평점 데이터를 통해 추천시스템을 만들어보자
- 프로젝트 진행 순서로 정리
- 데이터 불러오기
- 데이터 전처리
- CSR 매트릭스 만들기
- MF 모델에 넣어서 훈련하기
- 추천해보기
더 공부할 것
- Matrix Factorization 관련한 내용이 흥미롭다.