- 정보 소비자가 "원하는" 정보를 찾아 소비자에게 추천하는 시스템
- 검색은 소비자가 관심을 표현하는 "검색" 행위를 해야함 (pull, active)
- 추천은 특별한 행위 없이도 정보 전달이 가능 (push, passive)
- 사용자가 정보를 수집하는 시간을 줄여주는 것이 목적
- 더 많은, 다양한 아이템 판매 가능
- 고객의 만족도, 충성도 증가
분류
-
연관된 아이템 추천 (소비 중인 아이템이 있을 때)
-
개인화 아이템 추천 (소비 중인 아이템이 없을 때)
- ex) 유튜브 (틀어놓은 동영상이 없음에도 불구하고 보여줌)
- 마켓컬리는 개인화추천이 거의 없음(MD의 추천)
-
명시적 피드백을 사용하는 추천시스템 (explicit)
-
암시적 피드백을 사용하는 추천 시스템 (implicit)
(*유튜브는 명시적, 암시적 피드백 둘다 활용)
-
오프라인 추천 시스템 (정적 추천 시스템)
- 특정 시점의 데이터를 사용해 추천 결과를 계산
- 계속 똑같은 아이템만 추천할 우려 있음
-
온라인 추천 시스템 (최근 기업 추세)
- 지속적으로 사용자의 데이터를 받아 추천 결과를 업데이트
현업에서는 다양한 추천 로직이 섞인 하이브리드 추천 시스템 사용
종류
평가 방법
- 오프라인 평가
- 사용자의 아이템에 대한 선호 기록과 추천시스템이 추천한 결과를 비교하여 평가
- 별다른 비용 지출없이 수집된 데이터만 이용하여 평가 가능
- 여러 모델을 동시에 평가할 수 있음
- 선호 기록이 기존에 사용하고 있는 추천 모델에 영향을 받을 수 있으므로, 실제 사용자의 만족도와 평가 결과가 다를 수 있음
- 온라인 평가
- 만들어진 추천 시스템을 직접 사용자에게 노출 시켜 사용자의 반응을 수집하여 평가
- 실제 사용자의 만족도를 측정한다는 측면에서 정확한 방식
- 비용이 비쌈 (사용자의 이용만족도를 감소시킬 수 있음)
한계
- Scalability
- 학습 또는 분석에 사용한 데이터와는 전혀 다른 실전 데이터
- Proactive & Cold start
- Privacy
- Usage Context
- 모바일 디바이스, 위치 기반 서비스 등 개별 상황이나 환경에 따라 다른 컨텍스트 활용
- user preference의 유효 기간
- 추천 받고 싶은 아이템이 현재 또는 과거 중 어느 시기와 관련 있는지 알기 어려움
- Generic & cross domain 어려움
- 하나의 모델을 여러가지 데이터에 적용하기 어려움
- 비슷한 도메인의 데이터를 활용해도 동일한 추천 시스템의 성능을 기대하기 어려움
- Long tail economy
롱 테일에 있는 90%의 데이터를 충분히 활용하지 못하고 숏 헤드에 있는 10%의 데이터만 활용될 가능성이 있음.
좋은 추천 시스템이란?
- 적절한 아이템을 효율적으로 추천해주고, 추천해 준 이유 간단히 기재
- interactive한 프로세스를 통해 사용자가 플랫폼에 더 오래 머무를 수 있도록 하기
- 다양함, 참신함, 관련성 확인
- 실제 수익 향상 여부, 방문자의 행동변화 여부
[카카오AI리포트]내 손안의 AI 비서, 추천 알고리듬