Content Based Filtering
User u가 높은 평점을 주거나 큰 관심을 갖은 Item i와 유사한 아이템 x를 추천
- 예를 들어 영화의 장르, 배우, 감독 등 똑같거나 비슷한 특징을 갖은 영화(item)를 찾아서 추천
장점
- 다른 user의 data가 꼭 필요하지는 않다.
- 추천하는 이유를 제시할 수 있다.
- item의 feature로 컨텐츠 분석 가능
- 특정 feature가 추천의 이유를 설명 가능
단점
- 선호하는 특성을 가진항목을 반복 추천한다.
- overspecialization(과잉 전문화)
- user의 다양한 취향 반영(개인화)이 어려움
- 적절한 feature를 찾기가 어렵다
Item Based Collaboration Filtering
-
collaboration filtering
- neighborbood based(==memory based approach)
- item-based
user a, b, c, d가 item i, j를 평가 했을때 높은 유사도를 가졌을 경우 item i를 좋아하는 user들은 item j도 좋아한다고 추정할 수 있다.
-
예를 들어 user a, b, d 가 item i, j를 좋아하고 user c가 i를 좋아할 경우, user c에게 item j를 추천
장점
- Optimization(최적화)나 Train이 필요 없음
- 쉬운 접근 방식
단점
- 데이터가 별도로 축적되지 않으며, Sparse 한 경우 좋은 추천 서비스를 발휘하지 못함
- 평가되지 않은 아이템에 대해 추천을 하기 어렵다. (new-item problem)
CBF vs CF(Item Based)
위를 바탕으로 CBF와 CF(item based)의 차이점을 간략하게 적어본다면
- CBF : item 간의 유사도가 높을 경우 추천
- CF(item based) : user가 item에 rating을 줬을 경우, 이를 바탕으로 user와 item 간의 interation이 높을 경우 추천