RecSys - CBF

콘텐츠 기반 필터링 아이템에 대한 사용자 개인의 데이터를 이용해 과거에 사용자가 좋아했던 아이템과 비슷한 유형의 아이템을 추천하는 시스템 → 유사성을 무엇으로 파악하고 어떻게 계산하는지가 핵심 아이템의 특징을 추출하여 벡터로 표현한다. 벡터끼리의 유사도를 비교한다. 코사인 유사도(Cosine Similarity): 두 점 사이의 각도를 측정한 지표로, 값이 작으면 두 데이터가 가까이 있다 = 유사하다는 의미입니다. 유클리드 거리(Euclidean Distance): 두 점 사이의 거리를 측정한 지표로, 값이 작으면 두 데이터가 가까이 있다 = 유사하다는 의미입니다. 맨하탄 거리(Manhattan Distance): 두 점 사이의 거리를 측정하되, 수평-수직으로만 이동하는 거리를 구합니다. **k-근접이웃 알고리즘, DBSCAN과 같은 군집화 알고리즘을 적용, 유사도가 높은 아이템을 추천한다.

2022년 7월 19일
·
0개의 댓글
·
post-thumbnail

RecSys - CF

협업 필터링은 사용자와 아이템 간의 상호 상관 관계를 분석하여 새로운 사용자-아이템 관계를 찾아주는 것으로 사용자의 과거 경험과 행동 방식에 의존하여 추천하는 시스템이다. Domain Free 방식으로 관련 지식이 불필요하다는 장점이 있지만, 대표적인 한계점들이 다음과 같이 3가지 존재한다. Cold Start Problem ⛔ 문자 그대로 새로운 사용자나 새로운 아이템 등장 시, 기존의 관련된 경험 또는 행동 방식이 없기 때문에 추천이 곤란해지는 문제 Long Tail ⛔ 전체 추천 아이템으로 보이는 비율이 사용자들의 관심을 많이 받은 소수의 아이템으로 구성되어 있는 비대칭적 쏠림 현상이 발생하는 문제 계산 효율 저하 ⛔ 계산량이 많은 알고리즘이기에

2022년 7월 19일
·
0개의 댓글
·
post-thumbnail

추천 분야 기술 공부 및 정리

Goals of Recommender Systems 1) Prediction version of Problem. 학습데이터를 통해 유저의 선호도를 정확하게 예측하는 것 2) Ranking version of Problem. 정확한 수치보다는 랭킹을 고려해 top-k의 아이템을 선정하는 것 현실적으로 많이 필요로 하고 자연스러운 것은 2번이지만 추천 시스템의 일반적인 목적은 1번에 해당한다. 왜냐 1번이 해결되어야 2번도 해결될 수 있기 때문이다. Type of Recommender System 1. Collaborative Filtering Models 유사한 그룹에 묶이는 유저들끼리는 동일한 아이템에 대해 상관관계를 가질 것이라고 가정한다.

2022년 7월 19일
·
0개의 댓글
·