[추천시스템] Recommender System 개요

손아현·2026년 3월 10일

1. 추천시스템 분류

여러 기준에 따라 분류가 가능하다

추천 형식
- 별점/평점 예측, 추천 목록 나열 (순위 매기기)
사용 데이터
- 별점 데이터, 간접 피드백 데이터
- 유저 정보, 아이템 정보, 상황 정보
- 관계 정보
추천 방법
- collaboraitve filtering, content-based filtering
- memory-base, model-based

추천 시스템에서 고려해야 하는 challenge

Bias : 한쪽으로 너무 치우치는 추천. 정확도가 높더라도 너무 한쪽 (e.g. 한 브랜드)만 하는 건 좋은 추천이 아님
Fairness :
- 사용자 측면: 성별, 인종, 연령 등에 따라 차별적인 추천을 하지 않는가?
- 아이템 측면: 신규 판매자나 소외된 카테고리에도 노출 기회를 균등하게 제공하는가?
Cold-Start problem : 처음 데이터가 충분치 않아서 적절한 추천을 하지 못하는 상황
Filter Bubble : 확증편향, 점점 특정 분야로만 추천 (e.g. 강아지 릴스 시청 → 강아지 관련밖에 안뜸. 인스타는 커뮤니티 보다 강아지 앱이 되어버림)
Security, Privacy

데이터들의 유형

User : 나이, 성별,,,
Item : 제목, 이미지, 카테고리, 키워드,,,
Context : 시간, 위치,,,
User-Item Feedback
- Explicit Feedback: 사용자가 직접적으로 자신의 선호도나 평가를 표현한 데이터
  - 예) 별점,리뷰,좋아요/싫어요
- Implicit Feedback: 사용자의 직접적인 평가나 선호도 표현없이, 사용자의 행동으로부터 간접적으로 추론할 수 있는데이터
  - 예) 페이지조회수,구매이력,장바구니추가,스트리밍시간, 클릭기록
  
  User-Item Interaction Matrix (상호작용 행렬)
  위에서 언급한 User와 Item 간의 피드백 데이터를 수학적으로 구조화한 것을
  "User-Item Interaction Matrix, Utility Matrix, Rating Matrix" 등으로 부른다.

알고리즘의 복잡도, 데이터 활용의 범위 등에 따라 Basic, Advanced 로 분류할 수 있다.

Basic
이번 학기엔 대부분 Basic models을 주로 배우게 된다

Basic 모델을 분류하는 기준에는 크게 두 가지 관점이 있다.

Advanced

Multi-Amed Bandit (MAB) : 이건 베이지안 통계 수업 때 자세히 배웠었는데, 활용과 탐색 두 가지 중 하나를 선택하며 최적을 찾는 모델이다.
- 활용 : 지금까지의 데이터상 반응이 가장 좋았던 아이템을 보여주는 것.
- 탐색 : 확신하기에 아직 데이터가 부족하지만 잠재력이 있는 새로운 아이템을 보여주는 것.

Offline evaluation
사용중에 말고, 나중에 떼와서. 즉, 이미 수집된 과거 데이터를 사용하여 평가하는 방식
Online evaluation
실제 운영 중인 서비스 환경에서 '실제 사용자'를 대상으로 평가하는 방식
- A/B test : 여러 유저에게 다양한 버전으로 보여주고 → '어떤 버전이 클릭률이 더 높다더라' 하는 등의 분석 방법
  ex) 넷플릭스 썸네일, UI/UX 등 여러 버전으로 배포.
  실제로 서비스 기획 과정 중에, UT에서부터 MAZE 등을 사용해서 많이 했었다.

Acurracy
- Rating Prediction (별점/평점 오차 측정 방법)
  사용자가 특정 아이템에 부여할 구체적인 수치를 정확하게 예측하는 것이 목표
  - RMSE (Root Mean Square Error)
  - MAE (Mean Absolute Error)
- Item Ranking (추천 순서를 고려한 오차 측정 방법)
  사용자가 좋아할 만한 아이템을 순서대로 나열하는 것이 목표
  추천은 기존 머신러닝보다 “순서”가 훨씬 중요하다는 차이점이 있음
  - MAP (Mean Average Precision ) : 모든k에 대한 Precision@k의평균
  - NDCG (NormalizedDiscountedCumulativeGain)
  - MRR (Mean Reciprocal Rank)
Diversity : 얼마나 다양한가
Novelty : 얼마나 새로운가
Serendipity : 예상치 못한 즐거움을 주는가
Stability: 시스템이 얼마나 안정적인가

끝!

서비스기획/.AI/데이터분석