배경
일반 추천 시스템은 과거 피드백이 많은 콘텐츠를 우선 고려하기 때문에, 최근 올라온 'fresh' 콘텐츠는 노출 기회가 부족.
따라서, 신규 콘텐츠가 성장하지 못함
추천 아키텍처

Fresh content nominator
- two-tower 기반 CBF 사용
- query tower: 사용자 소비 이력 (user representation)
- candidate tower: 아이템 메타 정보 (item representation)
- positive feedback을 예측하도록 훈련
- item representation을 CBF 기반으로 생성하기 때문에, 콜드 스타트 추천에도 활용할 수 있음
- 실 서비스시엔 Multiscale quantization approach를 사용하여 Top50개를 검색
Graduation filter
- n번 이상 노출된 콘텐츠 제외 → 다른 Retriever에 의해 추천 가능하다고 판단한 듯
- n번은 지표 분포에 따라 선택
Ranking
- 2가지 components가 존재.
- 1) real-time pre-scorer
- 실시간으로 빠르게 상위 10개 후보 추출
- Thompson sampling 사용
- Prior, Posterior: Beta
- Likelihood: Bernoulli. 10초 이상 소비되었는지 여부
- 100회 이하로 노출된 콘텐츠는 posterior을 업데이트 하지 않음 (Global prior으로 설정)
- 100회 이하로 노출된 콘텐츠의 통계치는 신뢰도가 떨어진다고 판단.
- 2) DNN 기반 모델
- 정확도는 높지만 longer latency를 가지는 모델. 최종 Top1 추출
→ 구체적인 아키텍처는 논문에서 언급되지 않음
추천 성능
지표
- Daily Unique Impressed Contents at K (DUIC@K): 하루에 K번 이상 노출된 unique contents 개수
- Fresh Content Dwell Time (DwellTime): fresh content를 얼마나 오래 시청했는지
- Discoverable Corpus@X,Ydays: Y일 동안 X개의 positive interactions(10초 이상 시청)을 받은 content 개수
- fresh 추천 슬롯에서 메인 추천 슬롯으로 넘어갔을 때도 성공한 개수
