인지도 기반 추천 시스템

Hey:D·2022년 3월 22일
0

세상에나... 가짜연구소 🤔 추천시스템 톺아보기에 함께 하게 되었다 🛼 ~~

내용은 계속 추가 하면서 + 헤당 스터디 진행하면서 내용도 정리하기로!!

chapter01. 추천시스템 소개하기

추천시스템에 대해 앞에 다루지 않았던 내용에 대해 좀더 알아보자!

인기도 기반 추천

인기있는 아이템을 유저에게 추천해주는 것이다. 하지만 인기를 평가할 수 있는 지표가 필요하다.

점수를 계산하는 데 사용할 수 있는 몇 가지 요소로는,

  • 좋아요 👍🏻
    일반적으로 아이디가 있는 사람만 특정 작업을 수행할 수 있는 경우가 많기에 가장 신뢰할 수 있는 요소
  • 게시 시간
    사용자에게 제공할 새로운 유행게시물을 식별하는 데 도움이 되는 매우 중요한 요소
  • 댓글 수
    엄청 중요한 요소는 아니지만 (칭찬여부 파악 힘들어서), 댓글이 많을 수록 흥미롭다는 것을 유추할 수 있음.
  • 조회수/ 시청시간
    가장 불확실한 요소이므로 순위에 사용하는 것을 제한할 필요가 있지만, Google이 검색 결과에서 웹 페이지의 순위를 결정할 때 추척 클릭/이탈률을 사용하므로 사례가 있음.

등등 인기를 평가하기 위한 지표들을 사용하고 있다.

조회수가 가장 많은 아이템을 추천해준다.
조회수, 인기 (popularity)와 날짜(age)를 조합하여 점수를 만드는 것이 이에 해당한다.

(1) Hacker News

Hacker News의 점수화 알고리즘을 살펴보면 아래와 같다.

시간 (age)가 지날수록 score가 점점 작아지고 - 반비례
조회수 (pageviews)가 커질 수록 score가 커진다 - 비례

gravity 는 중력 상수로 시간에 따라 score 값을 조정하기 위해(오래될수록 더 작게 하기 위해) 사용한다.

(2) Reddit Formula

Reddit은 미국의 커뮤니티이다.

ups: 추천수, downs: 비추천 수

첫번째 term은 popularity, 두번째 term은 글이 포스팅 된 절대시간을 나타내 준다.

늦게 게지된 포스팅일 수록 더 높은 score를 가진다.

(3) 네이버 랭킹 뉴스 집계방식

PC와 모바일에서 이용자의 관심을 끌었던 기사를 다양한 랭킹 결과로 제공합니다
기사의 조회 수를 각 언론사별로 매시간 업데이트

  • 언론사별 많이 본 뉴스 : 조회수 집계
  • 언론사별 댓글 많은 뉴스 : 댓글수 집계

https://news.naver.com/main/ombudsman/automation.naver

Highly rated - 평균 평점 기반

평균 평점(연속적인 값)이 가장 높은 아이템을 추천해준다.

(1) Stream rating formula

average rating은 평균 긍정률으로 긍정 리뷰 수/ 전체 리뷰 수 로 나타낸다.


score를 두 부분으로 나눈다면,
1. average rating
2. 두 번째 묶음 -> 리뷰 개수에 따라 점수를 보정함.

즉, 리뷰 개수가 적을 때, rating을 보정하기 위해서 고안된 formula임을 알 수 있다.

rating은 평균값을 사용하지만, 전체 review 개수에 따라 rating을 보정한다.

review 개수가 아주 많아지면 score은 평균 rating에 근접하게 된다.(로그함수에 마이너스를 취함으로 수가 커지면 0으로 수렴하게 됨)

review 개수가 너무 적을 경우에 두번째 텀이 점수를 보정하는 역할을 하게 되는데,
0.5보다 avg rating가 낮으면 score가 조금 높게 보정되고 (음수가 되면서), 0.5보다 avg rating가 높으면 (두번째 텀 양수)로 score가 조금 낮게 보정한다.

출처

[1] 🤔 가짜연구소 추천시스템 톺아보기
[2]너무 잘 정리된 글1
https://sungkee-book.tistory.com/10
[3]너무 잘 정리된 글2
https://velog.io/@readymadelife/%EC%B6%94%EC%B2%9C%EC%8B%9C%EC%8A%A4%ED%85%9C%EC%9D%98-%EC%9D%B8%EA%B8%B0%EB%8F%84-%EA%B8%B0%EB%B0%98-%EC%B6%94%EC%B2%9C

[4]Reddit 및 Hacker News와 같은 인기 있는 순위 알고리즘은 어떻게 작동
https://medium.com/jp-tech/how-are-popular-ranking-algorithms-such-as-reddit-and-hacker-news-working-724e639ed9f7
[5]Reddit의 랭킹 순위 파헤치기
https://medium.com/hacking-and-gonzo/how-reddit-ranking-algorithms-work-ef111e33d0d9

profile
걸음마 분석가

0개의 댓글