추천프로그램 #01

MUUU·2022년 2월 9일
0

빅데이터

목록 보기
2/7

https://tacademy.skplanet.com/live/player/onlineLectureDetail.action


https://wikidocs.net/123689

https://www.facebook.com/groups/2611614312273351

https://root-decimal-c5d.notion.site/Recommender-System-KR-5b773a06e99145e6855bae391c94dc44

https://ziminpark.github.io/posts/danggeun/

https://data-artist.tistory.com/7

기업의 추천시스템
당근: 남들이 본 것 추천
브런치: 유사한글 추천

  • 롱테일의 법칙: 하위 80%가 상위 20%보다 가치가 크다

연관분석

Association Analysis:

  • 얼마나 같이 구매하는지
  • A와 함께 B를 구매하는지
  • confidence P(B|A)

Apriori








FP-Growth: Apriori 속도 개선

  • 단점: 아이템간의 연관성 찾기 어려움





https://www.kaggle.com/chocozzz/00-apriori-fp-growth

컨텐츠기반 추천 (vs 사용자기반)

1. 벡터 간 유사도 계산하여 추출



유클리디안

코사인


  • dice, divergence(분포유사도), sorensen도 많이 사용
  • 카카오브런치 추천대회 참조
  • 유사도 매트릭스 더하기 or
  • 매트릭스마다 모델 만들어서 추천결과를 결합

2. 벡터로 변환하는 법

  • 자연어, "텍스트", 이미지, 태블로데이터... etc

TF-IDF





  • TF-IDF 계산


https://www.kaggle.com/chocozzz/00-tf-idf-1

word2vec

  • 유사도 반영하는 임베딩방법론

CBOW

SKIP-GRAM (better)

https://www.kaggle.com/chocozzz/00-word2vec-1

컨텐츠기반 모델 정리

profile
데이터분석

0개의 댓글