추천시스템

김수정·2024년 1월 24일
0

공부

목록 보기
1/3

추천시스템

추천시스템은 사용자의 이전행동이나 기호, 아이템 간 데이터를 분석하여 사용자가 선호하는 상품을 예측하는 시스템

  • 추천시스템의 목적은 개인화된 맞춤 추천을 제공하는 것이다.

추천시스템 유형

1. 협업 필터링(Collaborative Filtering)

협업 필터링은 사용자 간의 상호 작용 패턴을 기반으로 추천을 하는 시스템으로, 주로 사용자들이 공통적으로 선호한 항목을 찾아내어 새로운 항목을 추천하는 기술이다.

비슷한 관심사를 가진 그룹이 있다면, 한 사용자의 데이터를 바탕으로 다른 사용자에게 추천해주는 방식이다.

즉, 사용자 간 유사성을 계산하여 비슷한 취향을 가진 사용자들이 선호한 항목을 추천하는 방식이다.

협업 필터링 알고리즘

  • 사용자 기반 (User-Based)
    사용자들 간의 유사성을 계산하여 특정 사용자와 유사한 다른 사용자들이 선호한 항목을 추천
  • 아이템 기반 (Item-Based)
    항목들 간의 유사성을 계산하여 특정 항목과 유사한 다른 항목들을 추천

한계와 해결법 : 콜드 스타트(Cold Start)

새로운 사용자나 아이템이 들어오면, 유사성을 분석하기 위한 충분한 데이터가 없기 때문에 대한 데이터나 상호 작용 정보가 없어 추천 정확도가 떨어지는 문제가 발생한다.

콜드 스타트 문제는 주로 두 가지 측면에서 나타난다.

  • 콜드 스타트 사용자 (Cold Start for Users): 새로 가입한 사용자나 데이터가 충분하지 않는 사용자에 대한 문제이다. 이러한 사용자들은 이전 데이터가 부족하기 때문에 취향, 선호도 등을 파악하기 어렵다.

  • 콜드 스타트 항목 (Cold Start for Items): 새롭게 추가된 상품, 서비스, 콘텐츠에 대한 문제이다. 이러한 콘텐츠는 충분한 평가나 상호작용이 이루어지지 않았기 때문에 정확한 추천이 힘들다.

이러한 문제를 해결하기 위한 방법이 몇가지 있다.

  • 온보딩(Onboarding)과정에서 충분한 데이터를 수집하기
    • 신규 사용자 또는 콘텐츠를 초기에 충분한 데이터를 수집하여 활용하는 방법이다. 대표적인 예시로 넷플릭스 가입 후 선호하는 콘텐츠 선택하기가 있다.

또는 소셜 네트워크 등의 외부 데이터를 활용하는 방법도 있다.

2. 콘텐츠 기반 필터링(Content - based Recommender Systems)

사용자가 과거에 좋아했던 항목과 유사한 제춤을 추천하는 시스템

콘텐츠의 항목(특징)과 사용자의 선호도를 기반으로 유사도를 비교해 추천해주는 시스템이다. 이를 위해 항목을 설명하는 키워드와 사용자가 좋아할 항목 유형을 명시하는 사용자 프로필을 구축한다.

  • 사용자 프로필의 경우 사용자가 이전에 평가한 항목이나 선호도를 기반으로 만든다. 이를 기반으로 항목의 특성과 유사성을 계산하여 추천한다.

3. 하이브리드 추천 시스템 (Hybrid Recommender Systems)

하이브리드 추천 시스템은 콘텐츠 기반 필터링과 협업 필터링을 함께 쓰는 추천 시스템이다.

  • 결합 (Combination): 협업 필터링과 콘텐츠 기반 필터링을 결합하여 두 가지 방법의 장점을 활용하는 방식
  • 평가 및 조정 (Weighting and Adjusting): 두 알고리즘의 결과를 가중 평균하거나 조정하여 최종 추천을 생성하는 방식

하이브리드 필터링의 역할

  • 새로운 아이템에 대한 추천 : 새로운 아이템에 대한 상호작용 데이터가 없을 때, 하이브리드 시스템은 아이템의 메타데이터(예: 카테고리, 태그)를 사용하여 유사한 기존 아이템을 기반으로 추천을 생성하여 정보를 제공해준다.

  • 새로운 사용자에 대한 추천 : 새로운 사용자의 경우, 사용자가 제공한 초기 정보(예: 관심사, 선호 장르)를 활용하여 추천을 시작할 수 있다.

사용자와 아이템의 메타데이터를 활용함으로써, 데이터가 제한적인 새로운 사용자나 아이템에 대해서도 효과적인 추천을 제공하는 것이 하이브리드 필터링이다.


추천시스템 데이터 유형

  • 명시적 피드백 : 사용자가 제품에 대해 제공한 명시적 피드백(평가 등)에 대한 데이터이다. 이는 사용자가 제품을 좋아하는지 여부를 직접적으로 나타낸다.

  • 암시적 피드백 : 암시적 피드백에서는 사용자가 제품을 어떻게 평가하는지에 대한 데이터가 없다. 예시로는 클릭, 시청한 영화, 재생한 노래, 구매 또는 할당된 태그 등이 있다.


참고링크
추천 시스템, 추천 알고리즘 종류

0개의 댓글

관련 채용 정보