이 글은 예측 모델링, 시계열 예측, 추천 시스템에 대한 주요 블로그 포스트 내용을 지속적으로 정리하여 제공합니다.
- 목적
- LinkedIn 피드 랭킹 시스템 개선을 위한 체류 시간(dwell time) 활용 방법 소개
- 회원 경험 향상을 위한 '긴 체류 시간' 예측 모델 개발 과정 설명
- LinkedIn 피드 랭킹 시스템 구조
- 2단계 퍼널 아키텍처: 첫 단계에서 후보 생성, 두 번째 단계에서 랭킹
- 다중 목적 최적화(MOO) 프레임워크 사용
- 시청자 측 최적화: 수동적, 능동적 최적화 포함
- 다운스트림 최적화
- 크리에이터 측 피드백 최적화
- 체류 시간의 중요성
- 암시적 사용자 참여 신호로 활용
- 수동적 콘텐츠 소비자의 행동 이해에 중요
- '긴 체류 시간' 모델링 도전 과제
- 업데이트 당 체류 시간 신호의 노이즈
- 적응형 임계값 부재
- 정적 임계값으로 인한 편향 도입
- 자동 정규화된 긴 체류 모델 (Auto Normalized Long Dwell Model)
- 바이너리 분류기 개발: 특정 비율(x%)의 유사 게시물보다 더 오래 체류할지 예측
- 정규화 기법 적용: 편향과 노이즈 해결
- 상위 K개 속성 식별: 체류 시간에 영향을 미치는 주요 요소 파악
- 동적 백분위수 계산: 일일 기준으로 업데이트되는 적응형 임계값
- 점수 유틸리티에 통합: 조정 가능한 가중치 적용
- 결과
- 사용자 참여 지표 향상 (세션, 총 체류 시간, 게시물 당 체류 시간)
- 수동적 콘텐츠 소비자들에게 특히 효과적
- 향후 계획
- 편향 및 특성 침투 이해
- 장기 참여 모델링을 위한 인과 추론 기법 활용
- 추천 시스템을 컨텍스추얼 밴딧(Contextual Bandit) 문제로 접근
- 사용자 방문을 맥락(Context)으로 간주
- 추천 내용 표시를 액션(Action)으로 처리
- 사용자 피드백을 즉각적인(스킵, 재생 등) 또는 지연된(시리즈 전체 시청, 구독 갱신 등) 신호로 활용
- 장기적 회원 만족도를 위한 보상 함수(Reward Function) 설계
- 단순 클릭률(CTR) 대신 복합적 사용자 행동 고려
- 예: 시즌 빠르게 시청 완료, 시청 후 평가, 새로운 장르 탐색 등
- 지연된 피드백 처리를 위한 접근법
- 관찰된 피드백을 기반으로 지연 피드백 예측
- 관찰 및 예측된 피드백을 모두 사용하여 프록시 보상 계산
- 두 가지 유형의 머신러닝 모델 사용
- 지연 피드백 예측 모델: p(최종 피드백 | 관찰된 피드백) 예측
- 밴딧 정책 모델: π(항목 | 사용자; r)로 실시간 추천 생성
- 오프라인-온라인 지표 불일치 문제 해결
- 프록시 보상 정의를 개선하여 장기적 회원 만족도와 더 잘 정렬되도록 조정