Fresh Content Needs More Attention: Multi-funnel Fresh Content Recommendation (2023, Google)

걱정 많은 데싸·2025년 10월 20일

배경

일반 추천 시스템은 과거 피드백이 많은 콘텐츠를 우선 고려하기 때문에, 최근 올라온 'fresh' 콘텐츠는 노출 기회가 부족.

따라서, 신규 콘텐츠가 성장하지 못함

추천 아키텍처

Fresh content nominator

  • two-tower 기반 CBF 사용
  • query tower: 사용자 소비 이력 (user representation)
  • candidate tower: 아이템 메타 정보 (item representation)
  • positive feedback을 예측하도록 훈련
  • item representation을 CBF 기반으로 생성하기 때문에, 콜드 스타트 추천에도 활용할 수 있음
  • 실 서비스시엔 Multiscale quantization approach를 사용하여 Top50개를 검색

Graduation filter

  • n번 이상 노출된 콘텐츠 제외 → 다른 Retriever에 의해 추천 가능하다고 판단한 듯
  • n번은 지표 분포에 따라 선택

Ranking

  • 2가지 components가 존재.
  • 1) real-time pre-scorer
    • 실시간으로 빠르게 상위 10개 후보 추출
    • Thompson sampling 사용
    • Prior, Posterior: Beta
    • Likelihood: Bernoulli. 10초 이상 소비되었는지 여부
    • 100회 이하로 노출된 콘텐츠는 posterior을 업데이트 하지 않음 (Global prior으로 설정)
    • 100회 이하로 노출된 콘텐츠의 통계치는 신뢰도가 떨어진다고 판단.
  • 2) DNN 기반 모델
    - 정확도는 높지만 longer latency를 가지는 모델. 최종 Top1 추출
    → 구체적인 아키텍처는 논문에서 언급되지 않음

추천 성능

지표 

  • Daily  Unique Impressed Contents at K (DUIC@K): 하루에 K번 이상 노출된 unique contents 개수
  • Fresh Content Dwell Time (DwellTime): fresh content를 얼마나 오래 시청했는지
  • Discoverable Corpus@X,Ydays: Y일 동안 X개의 positive interactions(10초 이상 시청)을 받은 content 개수 
    - fresh 추천 슬롯에서 메인 추천 슬롯으로 넘어갔을 때도 성공한 개수
profile
Data Scientist

0개의 댓글