2024 AI & ML Blog Highlights - Forecasting & RecSys

Jonas Kim·2024년 9월 3일
0

이 글은 예측 모델링, 시계열 예측, 추천 시스템에 대한 주요 블로그 포스트 내용을 지속적으로 정리하여 제공합니다.


Leveraging Dwell Time to Improve Member Experiences on the LinkedIn Feed (2024.10.01, LinkedIn)

  • 목적
    • LinkedIn 피드 랭킹 시스템 개선을 위한 체류 시간(dwell time) 활용 방법 소개
    • 회원 경험 향상을 위한 '긴 체류 시간' 예측 모델 개발 과정 설명
  • LinkedIn 피드 랭킹 시스템 구조
    1. 2단계 퍼널 아키텍처: 첫 단계에서 후보 생성, 두 번째 단계에서 랭킹
    2. 다중 목적 최적화(MOO) 프레임워크 사용
      • 시청자 측 최적화: 수동적, 능동적 최적화 포함
      • 다운스트림 최적화
      • 크리에이터 측 피드백 최적화
  • 체류 시간의 중요성
    • 암시적 사용자 참여 신호로 활용
    • 수동적 콘텐츠 소비자의 행동 이해에 중요
  • '긴 체류 시간' 모델링 도전 과제
    1. 업데이트 당 체류 시간 신호의 노이즈
    2. 적응형 임계값 부재
    3. 정적 임계값으로 인한 편향 도입
  • 자동 정규화된 긴 체류 모델 (Auto Normalized Long Dwell Model)
    1. 바이너리 분류기 개발: 특정 비율(x%)의 유사 게시물보다 더 오래 체류할지 예측
    2. 정규화 기법 적용: 편향과 노이즈 해결
    3. 상위 K개 속성 식별: 체류 시간에 영향을 미치는 주요 요소 파악
    4. 동적 백분위수 계산: 일일 기준으로 업데이트되는 적응형 임계값
    5. 점수 유틸리티에 통합: 조정 가능한 가중치 적용
  • 결과
    • 사용자 참여 지표 향상 (세션, 총 체류 시간, 게시물 당 체류 시간)
    • 수동적 콘텐츠 소비자들에게 특히 효과적
  • 향후 계획
    • 편향 및 특성 침투 이해
    • 장기 참여 모델링을 위한 인과 추론 기법 활용

Recommending for Long-Term Member Satisfaction at Netflix (2024.08.29, Netflix)

  • 추천 시스템을 컨텍스추얼 밴딧(Contextual Bandit) 문제로 접근
    • 사용자 방문을 맥락(Context)으로 간주
    • 추천 내용 표시를 액션(Action)으로 처리
    • 사용자 피드백을 즉각적인(스킵, 재생 등) 또는 지연된(시리즈 전체 시청, 구독 갱신 등) 신호로 활용
  • 장기적 회원 만족도를 위한 보상 함수(Reward Function) 설계
    • 단순 클릭률(CTR) 대신 복합적 사용자 행동 고려
    • 예: 시즌 빠르게 시청 완료, 시청 후 평가, 새로운 장르 탐색 등
  • 지연된 피드백 처리를 위한 접근법
    • 관찰된 피드백을 기반으로 지연 피드백 예측
    • 관찰 및 예측된 피드백을 모두 사용하여 프록시 보상 계산
  • 두 가지 유형의 머신러닝 모델 사용
    1. 지연 피드백 예측 모델: p(최종 피드백 | 관찰된 피드백) 예측
    2. 밴딧 정책 모델: π(항목 | 사용자; r)로 실시간 추천 생성
  • 오프라인-온라인 지표 불일치 문제 해결
    • 프록시 보상 정의를 개선하여 장기적 회원 만족도와 더 잘 정렬되도록 조정
profile
Sr. Data Scientist at AWS

0개의 댓글