오늘은 최신 content-based 추천 모델들을 배웠다.
CF 모델은 데이터가 적을 때 Cold-start 문제가 크다.
CBF 모델은 CF의 Cold-start 문제를 보완해줄 수 있다.
최근 트렌드는 다양한 멀티모달(비디오, 오디오, 텍스트) 콘텐츠를 활용한 추천 시스템 연구들이 진행되고 있다.
이미지 출처 : 논문
마이크로 비디오 추천을 위해 개발된 멀티모달 그래프 합성곱 네트워크
각 유저마다 선호하는 모달리티가 다르기 때문에 모달리티별 유저의 선호도를 파악하는 것이 중요하다. 각 모달리티(시각, 음향, 텍스트)별로 별도의 이분 그래프를 구성해, 그래프 합성곱 네트워크로 각 모달리티의 특징을 학습한다.
Aggregation Layer : 이웃 노드의 정보를 수집
Combination Layer : 수집된 정보를 통합(Aggregation+원래 유저(아이템) 노드+ID임베딩 노드)하여 최종 Representation 생성
Self-Supervised Learning for Multimedia Recommendation (2022)
Self-Supervised Learning(SSL)
unlabeled dataset에서 좋은 representation을 얻는 학습 방식으로 label을 사람이 지정해주는게 아니라 머신이 스스로 알 수 있도록 하는 방법.
label 없이 데이터 자체에서 학습 신호를 생성한다.
시각적, 텍스트, 음향 등 다양한 모달리티 정보를 통합해 각 모달리티별 특성을 보존하면서 상호 의존성 학습. 멀티 모달 콘텐츠에 대해 data augmentation을 적용했다.
교차 모달리티 대조 학습(contrastive learning)을 이용해 서로 다른 모달리티 간의 의미적 공통성을 보존한다.
멀티 미디어 추천시스템에서 문제가 되었던 데이터 희소성 문제, 레이블 데이터 부족 문제, 서로 다른 모달리티 간의 분포 차이를 해결했다.
이미지 출처 : 논문
triplet loss의 개념을 비디오 추천에 활용한 모델.
triplet loss
Anchor와 positive의 거리는 최소화하고, Anchor와 negative의 거리는 최대화 하는 loss 함수
현재 배치 안에서 anchor와 positive 쌍은 건들이지 않고, negative만 가까운 negative를 찾아서 재배치하는 작업을 모든 데이터셋에서 반복하는 과정을 거친 후 loss를 줄이는 훈련을 한다.
(anchor-positive보다 살짝 먼 negative를 골라야 한다. 아니면 collapse 위험이 있다)
데이터 소스로 영상에서 이미지와 오디오 특징 추출과 유저의 영상 시청 패턴 기반 그래프를 사용한다.
유튜브 시청이력 중 특정 영상이 anchor면 함께 많이 시청된 영상을 positive로 두고, 그 둘보다 거리가 살짝 먼 negative를 두고 triplet loss를 최소화 시키는 훈련을 한다.
pretrained된 모델을 활용해 앞단의 임베딩을 만들고(a), triplet loss를 최소화 시키는 훈련을 한다.
이미지 출처 : 논문
콜드 스타트 문제를 해결하기 위해 대조 학습을 활용한 추천 모델
사용자-아이템 협업(CF) 임베딩 간의 상호 정보와 특징 표현과 협업 임베딩 간의 상호 정보를 통합해서 사용한다.
Contrastive Pair Organization
U-I(User-Item) Pair : 상호작용이 있는 pos와 상호작용 없는 아이템중 랜덤하게 샘플링한 neg
R-E(Representation-Embedding) Pair : 한 아이템에 여러 모달리티의 feature가 있을 때, 같은 아이템의 feature면 가까워지도록, 다른 아이템은 멀어지도록 훈련
Contrastive Embedding Networks(CEN)
U-I CEN : CF와 비슷
R-E CEN : U-I CEN에서 만든 CF 임베딩과 Content 임베딩이 같은 아이템에서 나왔으면 가깝게, 다른 아이템이면 멀어지게 학습
이미지 출처 : 논문
기존 CBF 모델의 단점은 사용자가 비슷한 아이템이라고 해서 다 좋아하는게 아니고 취향이 있는데 그걸 잘 반영하지 못한다는 점. 이 모델은 cold start 상황에서도 사용자의 취향을 반영하기 위한 모델이다.
위의 cold start 모델은 협업 임베딩이 흐려지는(blurry) 문제가 있다.
이중 협업 필터링 구조 : CBCE와 COCE 간의 상호 정보 최대화
콘텐츠 기반 협업 임베딩(CBCE) : 아이템의 콘텐츠 특징을 협업 공간으로 매핑, cold-start에 적용 가능
공동 출현 협업 임베딩(COCE) : warm 데이터의 공동 출현 패턴 활용