group recommendation

emforce·2022년 5월 29일

대부분의 추천시스템은 개인화 추천시스템으로써 개인에 맞는 추천을 하게 되어있다.
하지만 항상 개인화 추천시스템이 필요한 것은 아니다. 그룹에 대해서도 추천을 해야할 때 가 있는데, DVD를 빌릴 때는 개인이 보는 것이 아닌 친구들과 함께 보는 경우가 있기 때문이다.
이 논문은 협업 필터링 추천시스템에 의해 생성된 평점 데이터를 이용하여 그룹 추천을 생성하였다. 이를 nDCG를 이용하여 분석하여 다음과 같은 결과를 얻어냈다.
1. 그룹 규모가 커진다고 해서(다양한 사람들이 들어갈 수록) 반드시 추천의 효과가 줄어드는 것은 아니다.
2. 개인화 추천시스템의 성능이 안좋을 경우 그룹 추천시스템의 성능이 더 좋을 수 있다.
3. 그룹의 사용자가 비슷할수록(상관성이 높을 경우) 그룹 추천의 성능이 좋다.

다양한 그룹이 존재할 수 있으며(안정적인 그룹, 권장사항이 필요한 임시그룹) 이들의 개별 선호도를 최대한 맞추는 것이 그룹 추천의 목적이다. 이 연구 영역의 주요 쟁점은 그룹 추천의 성능평가으 ㅣ어려움과 그룹에 의해 생성된 추천을 개별 구성원의 진정한 선호도와 비교하는 것이다. 일반적으로는 하나하나 인터뷰해보는 방법이 있다. 두 가지 접근 방식이 있는데, 그룹 추천에 대한 사용자의 개별 평가를 획득 후, 그것을 평균내거나, 또는 추천에 대한 그룹의 공통 평가를 직접 획득 하는 방법이 있다. 전자의 경우 평가를 통합하는 방법이 다양하다는 문제점이 있다. 또 공통적으로 문제점이 되는것이 개인의 만족도가 집단에게 영향을 받아 변화될 가능성이 존재한다.(감정적 전염) 후자의 경우는 오프라인 평가를 수행하며, 개인화 추천시스템의 성능비교 때와 같이 테스트 세트에서의 성능을 통해 비교한다. 우리가 사용하는 것은 후자.
그룹 추천시스템은 두가지 형태로 구현되는데, 먼저 개인에 대한 예측을 생성하고, 이 개별 순위 예측을 이용하여 그룹 순위를 만들어낸다. 그러고서, 이것을 사용자 프로필에 포함된 등급만을 고려하여 원래 순위보다 좋은 지 나쁜지 측정한다. 여기서 우리는 그룹의 크기, 내부그룹의 유사성, 순위집계 메커니즘에 따라 연구를 진행하였다.
두가지 직관 : 1. 그룹이 커질수록, 인원수가 많을 수록, 공감대를 찾기 어렵다. 성능나빠진다.
but 이것은 not true. 오히려 어쩔 땐 더 좋다. 또한 여기서 단순히 정확성이 아니라 순위의 올바름을 더 중요시 여기기에 최적의 순위를 찾는 문제, 케메니 최적 문제를 해결하는 것이 중요하다. 여기서 우리가 사용한 spearman footrule과 같은 경우 상당히 괜찮은 값을 보장한다는 것이 알려져있다.

여기서 사용된 집계 방법중 2개는 다음과 같은 심리학 실험에서 파생되었는데, 세 사람이 10개의 옵션에 대한 그룹의 평가지표를 통해 어떻게 순위를 배정할 것인지 실험한 것이 있다. 여기서 사람이 어떻게 랭크를 집계하는지 확인하였는데, 사람들은 평균 방법 (걍 평균 때리기) 혹은 최저 불행(최저점을 기준으로 랭크를 매기는 것)을 사용하는 것을 확인할 수 있다.
또한 올바른 순위를 확인하기 위해서 테스트 셋의 개인화-그룹화의 예측차이를 비교한다.

켄달 타우 거리 : 얼마나 잘못 순위가 배정되었는지 확인 하는 척도. 계산량이 매우 많아서 단순히 계산을 불가능 - 간접적 방법이 필요 : spearman footrule(최대 켄달타우거리의 2배 안에 거리가 생성됨), borda count(최대 5배 안에 차이가난다.) , 평균법, 최저 불행법 등등

figure 2. 랜덤 그룹과 유사성이 높은 그룹으로 나눈 후 그룹사이즈에 따른 비교
(일단 랜덤으로 배정해도 상당히 nDCG가 높다. -- 좀 섞어서 계산해도 원래 높게 나오는 편이다. 랜덤한 오더르 생성할 때 평균 nDCG는 거진 0.91이다.) (이걸 보여야할까요?)
랜덤의 경우 4~8까지 갈때까지 성능 엇비슷, 유사도가 높을시 오히려 성능이 더 좋은 경우도 나오고, 성능이 별로 크게 안떨어짐

figure 3. 그룹의 크기 별로, 그룹추천과 개인화 추천의 성능의 차를 나타낸 것.
초록색은 해당 차의 회귀직선, 거진 기울기가 -0.17~0.19로 비슷한편
위에 있으면 그룹추천이 이득인 경우, 아래의 경우 개인화 추천이 나은 경우이다.
x축은 개인화 추천시스템의 nDCG 보면 알다 싶이 일관적이게 개인화 추천시스템의 성능이 나쁠수록 그룹 추천시스템의 성능이 좋다.

figure 4. 그룹 유사도와 nDCG대비 유사도가 높을 수록 성능이 향상되는 것이 확연히 나타난다.
하지만 기울기가 0.22로 그렇게 강하지 않기에 연구가 더 필요하다.

emforce

이전 포스트

SASRec 코드리뷰

다음 포스트

group recommendation

SASRec 코드리뷰

Graph Contrastive Learning with Augmentations

0개의 댓글