[ML] 머신러닝 - 추천 시스템

GisangLee·2022년 7월 25일
0

ML

목록 보기
101/141

1. 추천 시스템

사용자의 취향을 알아내 새로운 아이템을 추천하는 것

Contents Based Filtering

Collaborative Filtering

  1. Memory Based
    - User Based
    - Item Based

  2. Model Based

2. 유사도 함수

유사도

  • 비슷한 정도를 나타내는 지표

종류

  1. 유클리디안 유사도

  2. 코사인 유사도

  3. 피어슨 유사도

  4. 자카드 유사도

유클리디안 유사도

코사인 유사도

  • -1 ~ 1사이의 값을 가진다.
  • 방향이 같은 경우 1, 반대일 경우 -1, 직각일 경우 0

피어슨 유사도

  • 유저 또는 아이템별로 가지는 특성을 제거

자카드 유사도


3. Contents Based Learning

유저가 기존에 선호한 아이템과 유사한 아이템을 추천


4. TF-IDF

유사한 관계임을 판단하는 방법

  • 텍스트 기반 컨텐츠의 특징 벡터를 추출하는 방법
  • 출현 빈도를 이용해 특성 문서 (d) 내에서 키워드 (w)의 중요도를 측정
  • 자주 등장하는 키워드는 낮은 중요도를 부여

TF

  • 특정 문서 내에 특정 키워드가 등장하는 빈도

IDF

  • 전체 문서 내에 특정 키워드가 등장하는 빈도

TF-IDF가 필요한 이유

  • 단어의 중요도를 반영하기 위함.
profile
포폴 및 이력서 : https://gisanglee.github.io/web-porfolio/

0개의 댓글