각 도메인의 user embedding을 독립적으로 훈련하고, 단순 aggregation하는 기존의 CDR 방식은 user-item cross-domain similarity를 무시하는 방법임
사용자의 관심의 정렬과 기존의 사용자의 관심 분포를 무시하는 방법임
저자가 제안하는 COAST는 user interest alignment와 entity 사이에서의 cross-domain similarity를 제공
Unified heterogeneous graph
redefine the message passing mechanism → user-item의 high-order 유사성을 포착
interest alignment가 뭐지?
⇒ “같은 사용자라면 여러 도메인에서도 유사한 관심사를 가지고 있다”
이 가정을 interest alignment라고 함.
cross-domain similarity를 무시한다고 했는데, 무슨 의미인지 모르겠음
⇒ 기존 CDR의 방식은 도메인별로 독립적으로 임베딩을 학습 후, 이를 단순 aggregation하기 때문에 도메인간의 관계는 제대로 학습할 수 없음
1. INTRODUCTION
CDR은 네 가지 분류로 나눌 수 있음
Collective MF
Mapping-based
GNN-based
Representation combination (overlapping entities)
COAST는 해당 방법을 차용했음
일반적으로 각 도메인의 임베딩 학습 → aggregation하는 방식
위의 방법들은 세 가지 challenges가 존재한다.
explicit dataset과 fully overlapping users에 대해서만 실험을 진행했다.
→ real world에서는 partial overlapping users와 implicit dataset이 훨씬 더 많다.
각 도메인별로 representation 학습 후 aggregation 하는 방식은 user-item 사이의 high-order similarities를 무시함
→ 도메인간 관계를 무시 (예, 사용자가 소셜 도메인들에서 공포장르를 선호한다)
추천 작업에 집중한 목적함수만으로는 도메인간 user interest alignment를 보장할 수 없다.
→ 추천모델이 추천정확도에만 집중하기 때문에 user interest alignment를 제대로 파악한채로 결과를 내놓는지 확인할 수 없음
도메인들을 하나의 unified cross-domain heterogenous graph로 표현
→ user-user, user-item 관점에서 deep insight를 얻을 수 있음
- user-user:
- 같은 사용자는 다른 도메인에서 같은 interest distribution을 가지고 있다.
- 동일 사용자에 대해 K개의 interest representation을 정해놓고 도메인간 representation들이 동일하게 나오도록 유도
⇒ 하나의 distribution으로 유도됨
- 사용자별 interest distribution이 다르게 나타나 instance-level에서 잘 구별할 수 있게 됨
- user-item:
- 사용자가 도메인에서 상호작용한 아이템은 그 사용자에 대한 직접적인 interest이다.
- 동일 사용자는 각 도메인에서 상호작용한 아이템에 대한 representation을 동일하도록 강제시킨다.
⇒ 각 도메인에서 일관된 gradient를 가지게 함
- Gradient alignment 기법을 사용하여 gradient가 한 방향으로 흐르게 강제하며, 고차항까지 적용시킨다.
K개의 interest를 설정한다는 방식에서 이전에 대희님이 발표한 K개의 intent를 설정한다는 개념과 비슷한 느낌이 들었다.
이후의 방식에서도 비슷한 방식을 사용하는지 알아봐야겠다.
COAST의 최종 Loss는 Supervised loss와 User-User alignment loss, User-Item alignment loss 세 loss를 적절히 사용하여 얻어짐.
3. EXPERIMENTS
3.1 Experimental Settings
3.1.1 Data Sets
Douban data set:
books, movies, music
shared user ID를 통해 overlap user를 식별 (Partial overlapping user)
COAST는 dual domain을 타겟으로하기 때문에 movie-book, movie-music, book-music으로 분리
Industrial data set:
mall, community 두 시나리오에서의 추천 향상을 위해 mall-community를 만들었음.
3.1.2 Parameter Settings
Parameters
Framework: PyTorch
Embedding Size: 64
Parameter Initialization: Kaiming method
Optimizer: Adam, with an initial learning rate of 5e-4
COAST는 movie-music task보다 movie-book task에서 추천 성능이 더 잘 나옴.
→ 데이터셋의 크기와 overlapping user의 수 때문인 것으로 생각됨. (향후 연구 예정)
3.3 Robust Testing
Overlapping user의 수, 하이퍼파라미터에 따른 실험 결과를 확인
3.3.1 Length N
평가지표인 HR@N, NDCG@N에 따른 실험 결과
N = 3 일 때, 향상률이 가장 높았음.
3.3.2 Overlap Ratio M
Overlapping user ratio에 따른 실험 결과
Overlapping user ratio가 증가할수록 추천 성능도 꾸준히 상승
COAST는 ratio에 따른 결과가 robust함.
→ Unified cross-domain heterogeneous graph, Message passing mechanism, User interest alignment로 인해 partial overlapping user 환경에서도 추천을 잘 수행하기 때문.
3.3.3 Ablation Studies
COAST와 5가지의 COAST 변형 모델들을 비교하였음.
COAST-NF: Explicit feedback만 사용
COAST-NS: Unified graph 대신 각 도메인 별로(source-target) representation 학습
COAST-NM: GCN message passing mechanism 사용
COAST-NU: User-User alignment 제거
COAST-NI: User-Item alignment 제거
3.3.4 Hyper-testing
Embedding size D
D = 64일 때 best performance
그 이상으로 갈수록 모델의 수렴속도가 느려지고 과적합이 발생
Number of Interests K
COAST는 K에 민감하다.
→ K는 사용자의 구체적인 관심을 나타내는 것이 아닌 추상적인 분포이기 때문임.
아이템과 사용자의 수가 많아지면 관심사 또한 많아지기 때문에 K를 증가시키면 됨.
INTRODUCTION에서 K개의 intent를 설정하는 것과 비슷하다고 느껴졌는데, 여기서 차이점이 드러났다. intent는 구체적인 관심사 하나하나를 말하는 반면, interest는 추상적인 관심사를 나타낸다.
Consistency weight λ2는 User alignment의 가중치를 담당하고 있음.
λ2가 증가하면, user alignment (User-User, User-Item)을 더욱 강하게 설정하기 때문에 일관된 도메인간 user representation을 얻을 수 있음.
λ2가 감소하면, 단순히 도메인간 representation을 aggregation하는 효과를 얻어 일관된 representation을 얻을 수 없음.
4. CONCLUSION
COAST는 dual cross-domain recommendation에서 향상된 성능을 보여줌.
두 도메인에서의 user-item interaction을 unified cross-domain heterogeneous graph로 표현, 개선된 message passing mechanism, user interest alignment를 이용하였음.
향후에는 multi-domain recommendation으로 확장시킬 예정임
COAST는 overlapping user ratio 보다도 두 도메인간의 유사도가 높을 때 큰 효용이 있어보인다.