정확한 사용자 및 항목 임베딩 학습은 현대 추천 시스템에 중요하다. 그러나 대부분의 기존 권장 기술은 지금까지 단일 유형의 사용자-항목 상호 작용보다 사용자의 선호도를 모델링하는 데 중점을 두었다. 많은 실제 권장 시나리오는 다중 유형 사용자 대화형 행동(예: 페이지 보기, 즐겨찾기 추가 및 구매)을 포함하며, 이는 현재 권장 솔루션으로는 처리할 수 없는 고유한 과제를 제시한다.특히: i) 다양한 유형의 사용자 행동에 걸친 복잡한 상호 의존성, ii) 지식 인식 항목 관계를 다중 행동 권장 프레임워크에 통합, iii) 다중 유형 사용자-항목 상호 작용의 동적 특성. 이러한 과제를 해결하기 위해 본 연구는 추천 시스템의 사용자와 항목 간의 다중 유형 대화형 패턴을 조사하기 위해 지식 향상 계층 그래프 변환기 네트워크를 제안한다. 구체적으로, KHGT는 i) 유형별 행동 특성을 포착하고 ii) 대상 행동에 대한 예측 작업을 지원하는 데 어떤 유형의 사용자-항목 상호 작용이 더 중요한지 명시적으로 구별하기 위해 그래프 구조 신경 아키텍처를 기반으로 한다. 또한 그래프 주의 레이어를 시간 인코딩 전략과 추가로 통합하여 학습된 임베딩이 전용 다중 사용자-항목 및 항목-항목 관계뿐만 아니라 기본 상호 작용 역학을 모두 반영할 수 있도록 한다. 세 가지 실제 데이터 세트에 대해 수행된 광범위한 실험은 KHGT가 다양한 평가 설정에서 많은 최첨단 권장 방법을 지속적으로 능가한다는 것을 보여준다.
추천자 시스템은 여러 곳에 널리 배포되었습니다.정보 과부하를 완화하고 사용자에게 가장 관련성이 높은 항목을 전달하기 위한 인터넷 서비스(예: 전자상거래, 온라인 검토 및 광고 시스템) (류 외 2020; 황 외 2019a) 암시적 피드백에 초점을 맞춘 권장 시나리오에서, 협업 필터링(CF)은 사용자-항목 상호 작용을 잠재 표현으로 분해하고 예측된 저차원 임베딩을 기반으로 사용자의 선호도를 예측하는 가장 인기 있는 패러다임 중 하나가 된다(Chen et al. 2020).비선형 기능 상호 작용을 위한 협업 필터링 아키텍처를 개선하기 위해 많은 심층 신경망 기술이 개발되었다. 특히, NCF(He et al. 2017) 및 DMF(Xue et al. 2017)와 같은 초기 연구는 비선형 상호 작용을 처리하기 위해 다층 퍼셉트론을 활용한다.또한, 자동 인코더 기반 방법은 고차원 희소 사용자 항목 상호 작용을 저차원 밀도 표현으로 매핑하기 위해 설계되었다(Sedhain et al. 2015;).Wu, DuBois et al. 2016). 이후 연구에서는 그래프 신경망을 사용하여 고차 사용자-항목 관계를 활용하고 이웃 기반 기능 집계를 수행한다(Zhang et al. 2019; Wang et al. 2019c).이러한 방법은 유망한 결과를 보여주었지만, 단일한 유형의 사용자 항목 상호 작용만 모델링하여 사용자의 다중 유형 행동에서 복잡한 협업 신호를 추출하기에 충분하지 않다는 것이 결점이다(Jin et al. 2020). 특히, 많은 실제 권장 시나리오에서 다양한 행동 특성을 나타내는 사용자와 항목 사이에 일반적으로 여러 관계가 존재하며, 이는 특히 대상 행동 유형에 대한 사용자의 선호도를 학습하는 데 도움이 된다(Guo et al. 2019). 예를 들어, 온라인 소매 플랫폼에서는 다양한 항목에 대한 사용자의 페이지 뷰와 즐겨찾기 추가 활동이 고객 구매 예측 작업(대상 행동)을 보조하는 보조 지식으로 작용할 수 있다. 따라서 사용자 선호도를 보다 정확하게 추론하기 위해 이러한 유형 간 행동 영향을 고려하는 것이 중요하다.
다중 행동 권장 사항을 실현하기 위해 해결해야 할 몇 가지 핵심 기술적 과제가 남아 있다.첫째, 다중 사용자-항목 상호 작용 동작에서 사용자별 협업 신호를 추출하는 방법은 해결해야 할 중요한 과제이다. 실제로, 유형별 행동 패턴은 카트 추가와 구매 행동 사이의 상호 보완적인 상관관계 또는 사용자의 부정적인 리뷰와 같은 복잡한 방식으로 서로 상호 배타적이다(Gao et al. 2019b). 사용자와 항목 간의 이러한 이기종 관계를 명시적으로 인코딩하지 않으면 모델은 복잡한 고유한 교차 유형 행동 의존성을 계층적 방식으로 캡처할 수 없는 어려움을 겪을 수 있다. 둘째, 지식 인식 항목 의미론적 관련성을 다중 행동 패턴의 인코딩 기능에 통합하는 것이 또 다른 핵심 과제이다.지식 인식 측면 정보는 종종 항목에 대한 많은 의미 있는 사실과 맥락적 연결을 포함한다(Wang et al. 2019a). 다중 행동 권장 사항에서 사용자-항목 및 항목-항목 관계에 대한 공동 임베딩 패러다임을 엄격하게 설계하는 것이 바람직하다. 셋째, 사용자-항목 상호 작용의 시간 정보를 더 잘 처리하기 위해 시간 인식 모델이 필요하다.권장 사항을 만들기 위해 다중 행동 대화형 패턴을 통합하려고 시도하는 소수의 최근 모델이 있다(Jin et al. 2020; Gao et al. 2019b). 그러나 이러한 작업은 비교적 독립적이고 로컬한 방식으로 다중 유형 상호 작용(예: 단일 차원 계단식 상관 관계)을 고려하고자 하며 사용자와 항목 간에 고차 다중 관계를 포착하기 어렵다. 또한 사용자-항목 상호 작용 역학뿐만 아니라 항목에서 부수적인 지식을 설명하는 방법은 이러한 다중 행동 추천 시스템에서 덜 탐구된다.이러한 차이와 과제를 고려하여 다중 행동 권고를 위한 일반적인 프레임워크인 KHGT(Knowledge-Enhanced Hierarchical Graph Transformer Network)를 제시한다. 특히, 첫 번째 단계에서는 사용자 및 항목 간의 행동 이질성을 주의 깊은 집계 스키마로 포착하기 위해 반복적인 임베딩 전파를 수행하는 다중 행동 그래프 변환기 네트워크를 개발한다. 결과적으로, 서로 다른 유형의 사용자-항목 및 항목-항목 관계는 특정 표현 공간을 유지할 수 있다. 행동 역학을 처리하기 위해 시간 인코딩 전략을 통해 시간 인식 컨텍스트를 그래프 변압기 프레임워크에 주입한다. 또한 유형별 행동 표현 간의 상호 의존성을 인코딩하기 위해 다중 행동 상호 주의 인코더가 제안되어 서로 다른 유형의 행동의 종속 구조를 쌍으로 학습한다. 마지막으로, 게이트 집계 레이어가 도입되어 권장 사항을 만들기 위한 유형별 관계 임베딩의 기여를 판별한다.