'여러 후보 가운데 가치 있는 것을 선정한다'
가치를 정의하는 방법에 따라 다양한 추천 알고리즘이 제안된다.
단순하게 열람횟수가 많은 상위 10개의 인기 아이템을 선택하는방법
사용자가 과거에 구입한 것과 유사한 것을 선택하는 방법 등
알고리즘 별로 계산은 빠르지만 예측도가 떨어지거나, 축적된 데이터 양이 충분해야 예측 정확도를 높일 수 있는 등 알고리즘별 장단점이 다양하게 있다. -> 비즈니스 목적에 맞춰 알고리즘을 적절하게 선택해야 함
| 입력(데이터입력) | 프로세스(추천설계) | 출력(추천결과제시) |
|---|---|---|
| 사용자와 아이템의 컨텐츠 정보 | 개요 추천 설계 | 첫 페이지에 표시 |
| 사용자와 아이템의 인터랙션 정보 | 연관 아이템 설계 | 상품 구입 후 메일로 전송 |
| 개인화 설계 | 우편으로 쿠폰 발송 |
사용자와 아이템의 콘텐츠 정보
사용자와 아이템의 인터랙션 정보
개요 추천(개인화 없음)
연관 아이템 추천
아이템 페이지 아래쪽에 표시되는 경우가 많음
이 아이템을 확인한 사람은 이런 아이템도 확인했다, 관련아이템 등
연관 아이템 설계에는 각 아이템 사이의 유사도를 사용, 유사도 설계에는 내용 기반 필터링 방법 과 협조 필터링 방법이 존재
아이템 유사도를 판단할 때도 비슷한 아이템일 가능성이 높을 때 유사도가 높다고 판단하는 관점, 함께 구입될 만한 아이템일 가능성이 높을 때 유사도가 높다고 판단하는 관점 존재
해리포터 문제가 존재, 특정 시기에 많은 사람이 해리 포터 서적을 다른 아이템과 함께 구입함에 따라 모든 아이템의 추천 아이템으로 항상 해리포터가 추천되었다. 인기아이템의 영향을 제거해야 할 경우도 존재
개인화 추천
사용자의 프로필이나 행동 이력을 기반으로 각 사용자에 맞춰 추천하는 것
개인화 추천은 콘텐츠를 기반으로 하는 방법과 인터렉션 데이터를 활용하는 방법이 있다.
콘텐츠를 기반으로 추천할 때는 나이나 거지주 등의 프로필 정보를 기반으로 그에 맞는 아이템 그룹을 설계한다.
사용자와 아이템의 인터랙션 데이터를 기반으로 추천할 때는 협조 필터링 등의 방법을 사용해 사용자의 과거 행동 이력으로부터 추천 아이템을 계산한다.
사용자 행동 이력을 기반으로 추천하는 방법 중에서도 열람 이력을 그대로 표시하는 추천은 구현 비용이적다. (리마인더기능)
열람 이력과 연간 아이템 추천 구조를 조합해서 사용하기도 한다. 쉽고 간단하게 개인화 할 수 있음
검색 시스템
검색 시스템은 다양한 문장이 디지털화됨에 따라 개발된, 키워드를 입력해서 원하는 문장을 찾아내는 기술
페이지랭크라 불리는 알고리즘이 많이 알려져 있다.
문장의 단어 정보뿐만 아니라 웹사이트의 페이지 사이에 존재하는 링크 정보를 사용해 중요한 링크가 더 많이 모인 웹사이트일수록 중요도가 높다고 판단
| 검색시스템 | 추천시스템 | |
|---|---|---|
| 사용자가 미리 마음에 든느 아이템을 파악하고 있는가 | 파악하고 있는 경우가 많음 | 파악하고 있지 않은 경우가 많음 |
| 키워드(쿼리) 입력 | 입력 있음 | 입력 없음 |
| 연관 아이템 추천 방법 | 입력된 검색 키워드로 사용자 의도 추측 | 사용자 프로필이나 과거 행동으로 추측 |
| 사용자의 자세 | 능동적 | 수동적 |
| 개인화 | 개인화하지 않는 경우가 많지만 최근에는 개인화 서비스가 증가하고 있음 | 개인화하는 경우가 많음 |
