✅ 추천 시스템이란?
정보 필터링 기술의 일종으로, 특정 고객이 관심을 가질 만 한 정보를 추천하는 시스템
- 맞춤형 경험 제공 가능
- 시간 단축 : 검색 및 항목을 타지 않고 direct로 콘텐츠 추천
- 커버리지 확보 : 예측 못한 콘텐츠를 접하게 하여 사용자가 선택하는 콘텐츠 폭을 넓혀줌
✅ 추천 시스템의 분류
추천 시스템은 사이트 특성에 따라 사용하는 알고리즘이 다르기 때문에 명확하게 분류가 어렵지만 기반 알고리즘에 따라 분류할 수 있음
📌 연관성 규칙 분석(장바구니 알고리즘, Association Rules)
- 추천 시스템의 대표적이고 고전적인 알고리즘
- 알고리즘에 대한 이해도가 높고 실제 효과도 뛰어남
- 사람들의 장바구니를 분석하여 통계를 쌓고 연관을 찾음
- 지지도, 신뢰도, 향상도를 이용하여 추천
- 콘텐츠를 분석하지 않고 사람들의 행동을 기반으로 분석하기 때문에 행동 기반 알고리즘으로 분류 가능
📌 협업 필터링(Collaborative Filtering)
- 사람들의 행동을 모아 나와 가장 유사한 사람이나 아이템을 찾아주는 방식
- 보통 User-Based Filtering을 말함
- 기존에 쌓여있는 데이터를 기반으로 추천하기 때문에 신규 고객 또는 신규 상품에 대해서는 추천이 어려운 cold start 문제가 있음
📌 콘텐츠 기반 필터링(Contents-based Filtering)
- 콘텐츠만을 가지고 추천하는 알고리즘
- 유튜브에서 영상 내용을 본문에 적거나 자막으로 콘텐츠를 추가하는 것, 쇼핑몰에서 주문한 옷과 비슷한 형상의 옷들을 추천하는 것
- TF-IDF, Word2Vec, Term-Based, Similarity, 문서 다중 분류 등
- 신규 고객 또는 신규 상품에 대한 cold start 현상이 없음
| 알고리즘 | 비교 |
|---|
| 장바구니 알고리즘 | A라는 행동을 할 때 B는 무엇일까 유추 |
| 콘텐츠 기반 | A라는 아이템과 가장 유사한 아이템은 B이다 |
| 유저 기반 협업 필터링 | A와 가장 유사한 사람은 B이며, A가 안 본 B의 아이템을 A에게 추천 |
📌 하이브리드(Hybrid)
- 일반적으로 협업 필터링과 콘텐츠 기반 필터링 방식을 조합하여 상호 보완하는 방식으로 추천하는 방법
- 협업 필터링의 cold start 문제를 해결하기 위해 콘텐츠 기반 필터링 기술로 분석하고 충분한 데이터가 쌓이면 협업 필터링 방식으로 추천 정확성을 높이는 방식
📌 하이브리드 시스템의 한계
하이브리드 시스템이 콜드스타트 문제를 완화할 수 있지만, 이 문제를 완전히 해결할 수는 없다. 새로운 사용자와 아이템에 대한 정보가 전혀 없는 경우, 여전히 추천의 정확성이 떨어질 수 있다. 또한, 여러 모델을 결합하므로 시스템의 설계와 구현이 복잡해질 수 있으며, 데이터 처리 및 모델 간의 조정이 필요하다.
간단히 구현해 본 코드는 아래와 같다.
하이브리드 추천 시스템 구현 예제
참고자료
파이썬(Python)으로 하이브리드 추천 시스템 모델 구현하기
추천 시스템 Recommender System
추천 시스템(Recommender System)