Lending Interaction Wings to Recommender Systems with Conversational Agents (NeurIPS 2023)
Introduction
- RS는 매우 유용한 tool, but 현재 연구는 offline history에 한정됨
- Alexa, GPT와 같은 conversation tool은 일상에 효과적으로 스며듬
- current RL based 접근 방식은 다량의 데이터를 요구
- 우리는 LLM agent와 RS를 plug-and-ply 방식으로 연결
- 목적은 최소한의 상호작용으로 사용자를 만족시킬 항목을 찾는 것
- 우리의 CORE는 RS를 offline relevance score estimator로 사용하고, agent를 online relevance score checker로 사용
- 우리는 agent의 질의를 통해 해소되는 uncertainty 지표를 제시한 뒤, 최대 확실성을 가지는 item을 제시하는 의사 결정 트리 알고리즘을 생성함
- 사용자는 어떤 속성에 대한 명확한 선호도를 가지지 않거나, 특정 값에 대한 선호도를 가질 수 있음, 이 때에는 binary asking이 더 효과적일 것
- 우리의 CORE는 RS, LLM에 어떠한 제약이 없으며, 8개의 데이터셋에서 SOTA를 달성
Bridging Conversational Agents and Recommender Systems
- ΨRE:U×V→R
- offline estimator로, relevance score를 estimate
- ΨCO:U×A→R
- online checker로, user에게 relevance한 item이 유저에게 적합한지 check
- Uk:=∑vm∈VkΨRE(vm)
- 모든 item에 대한 uncertainty의 총합으로, 0이 될수록 좋음
- 어떤 attribute에 대해 선호를 확인하였으면, 그 item들에 대한 uncertainty는 0이 되는 것
- minΨRE∗K,s.t.,UK=0
- uncertainty가 0이 되는 turn을 최소화 하는 것이 objective
Comparison to Previous Work
- Conversation과 Recommender system을 align하는 이전 main branch는 systematic하게 결합하는 것
- 이는 time consuming, high complexity cost 등에서 제약이 존재
- 우리의 general agent는 item, attribute를 query할 수 있으며 RS에서 relevance score만을 필요로 함
- CORE는 간단하게 모든 supervised recommendation platform에 적용할 수 있으며, 어떠한 reward function을 적용할 수 있음
Making the Conversational Agent a Good Uncertainty Optimizer
Building an Online Decision Tree
- agent의 목표는 item, attribute를 query함으로써 uncertainty를 최소화 하는 것
- 우리는 expected certainty gain을 도입하여 제거함으로써 기대되는 불확실성을 예측함
- aquery=argmaxa∈Vk−1∪Xk−1ΨCG(query(a))
- attribute에서도 비슷하게 formulization 됨
From Querying Attributes to Querying Attribute Values
- 위 figure의 예시와 같이 attribute 집합에 속하지 않는 답변을 받을 수 있음
- 이 때에는 속성ID 대신 value에 대한 query를 통해 binary question으로 전환함으로써 명시적인 정보를 획득할 수 있음
Plugging the Conversational Agent into Recommender Systems
Overall Algorithm
- RS에는 어떠한 제한 없음
- 다만 동일한 속성에서는 작동할 수 없음
Making certainty gain Consider Dependence among Attributes
- attribute간의 상호작용을 통한 certainty gain또한 고려해야함
Empowering agent to Communicate with Humans
- CORE의 답변에서 User는 모호한 태도로 일관할 수 있음
- 이러한 경우에는 GPT-3.5 등의 외부 LLM을 사용하여 통합 가능