작성자: 김현지
논문: https://www.hongliangjie.com/publications/wsdm2020.pdf
E-commerce에서의 추천
e-commerce에서 고객들은 최근의 행동이나 기본적으로 가지고 있는 선호와 관련이 없는 구매를 하기도 한다. 예를 들어 6월에 샌들을 사는 고객은 12월에 있는 다음 쇼핑에서 '여름 휴가'와 관련된 아이템을 추천 받고 싶지 않을 것이고, 자신의 취향에 맞지 않은 아이템을 친구의 생일 선물 때문에 구입할 수도 있다.
1. 콜드 스타트 문제를 완화할 수 있다.
여름에는 서핑보드를 추천하고, 겨울에는 스노우보드를 추천
2. Occasion으로 유도된 구매로 인해 유저의 intrinsic preference에 생기는 노이즈를 줄일 수 있다.
다른 사람을 위한 선물 등 Occasion으로 인한 구매는 유저의 일반적인 구매와 비교해 다른 패턴을 보일 수 있으며 이를 파악해 제거 가능
3. 다시 나타날 수 있는 패턴들에 대해 관련 아이템을 추천할 수 있다.
매념 어버이날에 정확히 똑같은 아이템을 구매하지 않을 수 있지만 이전 어버이날에 구매한 물품과 관련이 있을 가능성이 높다.
Etsy와 Amazon의 데이터를 사용
아마존 구매 데이터에서는 리뷰에서 언급된 키워드로 유저의 쇼핑 장소나 의도를 대략적으로 추론할 수 있다.
→ 월별 발생 리뷰를 키워드 기반으로 요약하고 occasion을 파악
개별 유저들에게 다시 발생할 수 있는 occasion: 매년 부모님의 생신
→ 이러한 반복되는 occasion은 몇 년에 걸쳐 유사한 쇼핑 행동을 유발할 수 있음.
→ 이러한 personal occasion들의 패턴과 그것이 추적 가능한지 여부 확인.
Etsy에서 wedding과 anniversary를 위해 아이템을 구매한 유저 7천여명을 대상으로 time gap 측정하였다.
절반 이상의 유저들이 30일 이내에 시차를 두고 원래 wedding과 관련된 구매 시기 근처에 anniversary를 위해 구매하였다.
→ 다년간 특정 기간(연간 또는 월간)내에 event로 인한 구매가 발생하는 Personal Occasion이 존재
Infants items 구매가 50% 이상인 유저들의 구매 패턴을 측정한다.
→ 유아용 제품 구매가 쇼핑에 대한 intrinsic preference라고 볼 수 있다.
이러한 유저들은 고유한 선호도에서 벗어난 6월 달에는 아버지의 날과 관련된 아이템을, 1월에는 발렌타인데이를 위해 쇼핑을 하는 경향이 있다.
→ 이러한 상황은 매년 발생할 수 있으며 매년 유사한 기간에 구매 선호도에 영향을 미칠 수 있다.
또한 occasion에 따라 준비 시간이 달라질 수 있다. 유저들은 발렌타인이나 아버지의 날보다 크리스마스를 더 일직 준비하며 쇼핑을 하는 경향이 있다.
이러한 간헐적 발생 신호를 포착하고 다시 발생할 상황이 가까워질 때 추천을 조정하는 것이 중요하다.
⇒ 목표: 시점에 유저 가 구매할 아이템 을 예측하여 추천하는 것
유저의 고유한 선호도를 식별하기 위해 최근 구입 항목과 이전 항목 간의 상관관계를 활용하는 방법
개인의 쇼핑 기록을 추적하여 주기적으로 발생할 수 있는 personal occasion에 대한 유저의 선호도를 모델링하고 예측하는 방법
각 유저마다 같은 personal occasion으로 인한 구매는 작은 time window를 가질 가능성이 높다. 예를들어 친구 생일 선물은 생일 2~3주 전에 구입한다.
→ 즉 다음 아이템을 예측할 때 작년, 재작년 이맘 때의 기록이 영향을 준다.
crowd behavior를 기억하고 관련 global occasion를 파악하기 위해 동적 매핑을 수행하는 방법
좋은 추천을 위해 유저의 고유한 선호도와 다양한 유형의 occasion들을 어떻게 융합할 수 있는 가?
마지막으로 유저의 intrinsic preference와 다양한 occasion 신호의 균형을 맞추는 방법에 대해 논의
이전 섹션에서 논의한 각 구성 요소에 서로 다른 가중치를 할당하는 방법을 제어할 수 있는 gating layer 도입
타임 스탬프마다 유저의 상태가 다르기 때문에 쿼리는 유저의 시간 스탬프 쌍이 된다.
→ 예를 들어 수공예 용품을 좋아해서 Etsy와 같은 사이트에서 다른 물품을 거의 구입하지 않는 유저들도 있고, 어떤 유저는 12월에는 occasion의 영향을 많이 받지만 6월에는 intrinsic preference를 거의 유지할 수도 있다.
시간을 기준으로 데이터 split
Timestamp embedding은 하루를 기준으로 진행
Etsy: 핸드메이드 제품을 판매하는 최대 e-commerce 플랫폼
— 2006년 11월부터 2018년 12월까지 구매 데이터 수집
— 5회 미만 구매 유저는 제거
— 최근 2년 내에 구매를 한 유저만 포함
— 첫 구매와 마지막 구매가 1년 이상 차이나는 유저만 포함
Amazon: 1996년 5월 부터 2014년 7월까지 제품 리뷰를 포함한 데이터 셋 수집
— 각 리뷰를 구매 기록으로 취급하고 리뷰를 입력하는 시간을 구매 시간의 근사치로 사용
— 5회 미만 아이템 구매 유저는 제거
Metrics
MRR@K, NDCG@K
Baselines
MP, MF-BPR, Fossil, GRU4REC, TCN, HPMN, SASREC
1. Temporal Information and Occasions
14기 박지은
e-commerce에서는 추천시스템을 설계할 때 전제하는 기본 가정과 다르게, 유저가 행동 순차 정보나 기본적 선호와 관련이 없는 구매가 이루어지기도 합니다. 구매를 유발하는 특정 시간이나 이벤트를 occasion이라고 하는데, 이러한 occasion과 쇼핑 행동 사이의 연관성을 활용하면 cold start 문제를 완화하고, occasion으로 유도된 구매로 인한 유저의 intrinsic preference에 생기는 노이즈를 줄일 수 있으먀, 다시 나타날 수 있는 패턴들에 대하여 관련 아이템을 추천할 수 있습니다. 본 논문에서는 occasion 패턴을 파악하여 모델링하여 유저의 행동에 어떻게 영향을 주는지 연구했습니다. 먼저 추천을 위한 ocassion signal을 알아내기 위해 GMP 모델과 TMP 모델을 이용하여 time window를 기준으로 어떤 아이템이 인기가 있었는지 순위를 매기고 이를 비교하여 ocassion 기반 쇼핑 추세가 있음을 알아낼 수 있습니다. 또한 개별 유저에게 발생할 수 있는 ocaasion의 파악을 위해 기념일 아이템을 구매한 유저의 time gap을 측정하여, 이러한 간헐적 발생 신호를 포착하고 재발생할 상황이 가까워질 때 추천을 조정하는 것이 중요하다고 합니다. 이러한 occasion을 반영하여 Occasion-Aware Recommendation(OAR)이 제안되었는데, 이는 neural attention mechanism을 사용하여 target query와 context contents 간의 상관관계를 포착하게 합니다. e-commerce에서의 추천시스템은 유저의 소비 패턴이 중요하게 영향을 줄 것이라 생각은 했지만, 이런 식으로 유저를 모델링하는 접근법을 알게 되어서 매우 유익한 강의였습니다. 감사합니다!
[15기 이성범]
본 논문은 Occasion이라는 구매를 유발하는 특정 시간이나 이벤트를 추천 시스템의 중요한 피드백이라 생각해 Occasion을 임베딩 하여 학습시킴으로써 시간에 따른 특성을 추천 시스템에 반영하는 방식을 제안한 논문이다.
여름철에는 스웨터 대신 샌들을 많이 구매하고, 꽃무늬 아이템은 봄과 여름에 인기가 많다. 이처럼 특정 시점에 따라 구매자의 선호도는 달라지고 특정 기간의 Occasion을 capture 할 수 있다면, 추천 시스템의 성능을 높일 수 있다.
Occasion Signal을 활용하는 추천 시스템 모델로는 General Most Popular 모델과 Temporary Most Popular 모델 등이 존재한다. GMP는 유저에게 가장 인기있는 항목을 추천하는 간단한 모델로 콜드스타트 문제에 효과적이다. 반대로 TMP는 최근 Time Widow내에 따라 순위를 매기는 방식이기 때문에 Occasion이 중요한 시기에는 GMP보다 더욱 높은 성능을 보일 수 있다.
본 논문에서는 Occasion Signal을 학습할 수 있는 모델로 Occasion-Aware Recommendation(OAR)을 제안했다. 데이터는 시간을 기준으로 split하고 Timestamp Embedding을 하루 기준으로 진행한다. OAR은 Sequence 학습에 효과적인 학습 방식인 Attention Mechanism을 활용한 모델로 최근 구입한 항목 또는 예측을 위한 미래의 타임스탬프 와 구매 이력 사이의 상관관계를 포착하는 식으로 학습이 진행되며, 쿼리가 유저의 시간 스탬프 쌍으로 구성되어 있어서 유저의 고유한 선호도 외에도 다양한 유형의 Occasion 신호도 고려하여 학습한다.
시간을 임베딩 한다는 관점이 신기했으며 본 모델은 현 시점의 중요한 Item을 capture하는데 높은 성능을 가져올 수 있는 모델이라고 생각한다.