
pinterest에서 FAccT 2023에 제출한 논문으로, 특별히 새로운 아이디어는 없지만 장기적으로 사용자를 꾸준히 만족시키는 건강한 추천시스템을 만들기 위한 운영적인 노하우를 얻을 수 있는 논문입니다. 추천시스템의 고질적인 문제인 다양성/효용성 최적화에 대해 고민중인 분들에게는 괜찮은 시작점이 될 수 있을 것 같습니다.
한국어 의역을 최대한 하려고 했으나, 영어가 더 맞는 전문 용어들은 왠만하면 그대로 두었습니다.

multi-stage diversification system을 개발하였다. greedy reranker와 determinaltal point process(dpp)를 활용한 multi-objective optimization을 개발하였다.Strong-OR 을 활용하여 토큰 기반 인덱스에 대한 검색을 하였고, Overfetch-and-Rerank and Bucketized-ANN 을 활용하여 임베딩 기반의 인덱스에 대한 검색을 하였다.

(K>K) 개를 뽑은 뒤 여기에 round robin을 적용하여 K개로 줄인다.
k-Dimensional Tree, Locality-sensitive Hasing(LSH), Hierarchical Navigable Small Worlds(HNSW) 방법들이 사용된다.Bucketized-ANN Retrieval은 조금 다르다.overfetch 방법론에 비해 우위가 있다.
STRONG-OR이라 불리는 특별한 논리 연산자를 사용한다.

DPP + Bucketized-ANN Retrieval 을 적용한 결과임.Overfetch-and-Rerank + DPP가 베스트