CBF

Han Hanju·2023년 5월 18일
0
post-thumbnail

CBF 기반 예측

  • 아이템 유사도기반 평점 예측
    • 가정: 유사한 영화에는 유사한 평점을 부여할 것이다.
  • 컨텐츠 기반 유사도
    • 두 아이템간 유사도를 어떻게 정량화 할 것이냐가 관건
    • 유사도를 정량화 하기 위해 컨텐츠 자체가 가진 특성을 활용
      • 뉴스: 제목, 기사내용 등
      • 영화: 장르, 감독, 출연자, 줄거리 등
      • 상품: 카테고리, 가격, 상품 이미지, 상품설명 등
      • 집합의 유사도로 표현이 가능하다.
          • 자카드 유사도를 많이 사용하지만, 예를들어 장르나 이런것들이 미치는 정도를 더 자세히 반영하고 싶다면 가중치를 이용하는게 좋다.
            • 벡터공간으로 확대

유사도 계산을 위한 기초 수학지식


  • Distance & Simailarity

    • 피어슨과 코사인 유사도는 사실 같다..

      • 키/몸무계는 상관성에 대해서는 피어슨 유사도가 더 적합하다.
  • Representation

    • Bag of words
    • TF-IDF
      • ex
        • 평점 예측
profile
Data Analytics Engineer

0개의 댓글