Cheng Wang at al
WWW (2025)
source domain의 선호도 정보를 보조정보로 사용하여 target domain에서의 추천을 향상시키는 CDR
따라서, CDR은 knowledge transfer process가 필수적임
→ 주로 user embedding, mapping relationship에 대해 집중하고, user preference를 전송되는 latent space와의 bridge function에 의존
이를 위한 original plaintext embedding, interaction data은 GDPR이라는 새로운 보안규제로 인해 사용할 수 없음
→ CDR은 data privacy의 보장하는 모델을 고안해야함
저자들은 privacy-preserving knowledge transfer에 집중
최근 많은 privacy-preserving CDR은 다른 privacy mechanism을 적용시켜 original embedding에 대한 보안을 유지하고 있음
→ Privacy budget이라는 노이즈 강도를 조정함
- Privacy Budget
1. original embedding에 noise를 추가하여 학습
2. 이때 noise의 강도를 조절하는게
3. 을 크게 → noise를 약하게 → privacy 강도 ⬇️
을 작게 → noise를 강하게 → privacy 강도 ⬆️
이러한 방식으로 인해 기존의 privacy-preserving CDR은 utility-privacy 간의 균형을 잘 잡아야 함 → Traditional CDR보다 optimal하지 못함
user privacy를 보호하는 건 CDR의 challenge임
CDR에서의 개인정보유출은 도메인간 original user embedding, user rating information를 transfer하는 중 발생함
→ user information 대신 item embedding을 사용하여 privacy도 지키고 satisfactory performance도 달성할 수 있을까?
저자는 이러한 idea를 확장한 Privacy-friendly Cross-domain recommendation (PFCDR)을 제안
→ target domain을 promote하는 prototype을 아이템 임베딩으로부터 추출
user embedding을 사용하지 않는 data-free 조건을 추가하고, 이 조건때문에 prototype을 사용, 이를 생성하기 위해 conditional model inversion mechanism을 고안
하지만, CDR task에서 model inversion을 구현하는 것은 task의 특징으로 인해 어려움
RS의 데이터는 ont-hot representation으로 표현이 됨
→ gradient 계산이 어려움
universal learning paradigm이 필요
⇒ gradient 계산을 위한 continuous & dense data format을 설계
개인정보보호를 위해 사용자 정보를 아예 사용하지 않는 data-free 조건이 추가되었음
source domain의 user-item interaction, user embedding을 전혀 사용하지 않음
pre-trained model을 이용하여 input을 조정해야함 → model inversion
하지만 input이 one-hot이라 gradient를 계산하는데 어려움
gradient를 계산하기 쉽게 continuous & dense data format을 설계
5-1. 현재 방법으로는 아이템 4번째, 5번째 그 자체에 대해서만 수정할 수 있지만, 아이템 4번째를 30%만 조정해보는 조작이 안됨
추가로 cold-start scenario에서 source domain의 user prototype을 pre-trained bridge function을 통해 target domain으로 전송하여 cold-start를 완화시킬 수 있음

따라서 user embedding과 interaction r을 고정시켜 b에 대한 gradient update를 수행하는 conditioned model inversion을 고안
두 도메인의 아이템들이 다름
두 도메인의 임베딩 사이즈가 다름
⇒ b를 source domain item embedding V와 weighted sum으로 해당 사용자에 대한 대표 성향을 나타내는 prototype으로 함축
: Prototype
: parameter of mapping function
: A linear layer
: MSE
여기에서 는 linear layer의 parameter 포함



> Book → Movie: 책을 기반으로 영화를 만듬
Music → Movie: 영화에 음악이 등장
> 