프로젝트 개요
데이터 전처리
피처 벡터화(모델학습)
유사도가 높은 단어들은 하나의 장르로 특정단어(장르) 개수 설정 (10개)
유사도를 기준으로 그룹별로 범주화작품에 해당하는 장르를 컬럼 추가해서 저장 (ex. 장르1, 장르2...)이 후 태그형식으로 장르에 부합한 작품들이 조회될 수 있도록
장르 세분화하기
콘텐츠 기반 필터링
이제 실제 데이터를 가지고 추천 시스템 테스트
생성한 테스트 추천 시스템을 가지고 FAST API에서 작동 확인
KNN(K-Nearest Neighbors) SVD (Singular Value Decomposition, 특이값 분해)