df['keywords'] + df['cast']
pd.Series
형태인데, 저렇게 연산자로 붙일 수 있나? 싶어서 생각해보니sklearn.feature_extraction.text.CountVectorizer()
sparse하다는 뜻...
협업 필터링에서 아이템 기반은..
협업 필터링 요약하면
사용자 기반: 당신과 비슷한 고객들이 다음 상품을 구매했습니다.
아이템 기반: 이 상품을 선택한 다른 고객들은 다음 상품을 구매했습니다.
특이값분해(singular vector decomposition)
추천시스템과 머신러닝의 관계...
train, test 혹은 validation set을 나누는 방법이 많은 것 같다.
pd.DataFrame.sample()
도 있고,tensorflow model.fit(validation_split=)
하면 트레이닝 셋에서 일부를 validation 셋으로 쓴단다.