[Machine Learning] 추천 알고리즘 스터디

김서영·2020년 12월 7일
1

[Machine Learning] 추천 알고리즘 스터디

CurVelio에서는 사용자에게 맞춤형 강의를 추천해주는 기능이 있다. 처음에는 개인의 성적을 분석하여, 강의를 추천하고자 했으나 성적표를 크롤링 할 수 없다는 학교의 답변에 다른 추천 방법을 이용해보려고 한다. 그래서 우선 추천 알고리즘의 종류를 한 번 살펴보자.

넷플릭스나 유투브를 이용하다보면, 모두 사용자에게 맞춤형 콘텐츠를 추천해주곤 한다. 찾아보니, 특히나 넷플릭스는 추천 알고리즘 종류만 100개가 넘는다는 글도 보았다. 이 중 가장 핵심이 되는 두 가지 알고리즘에 대해 살펴보았다.

1. 콘텐츠 기반 필터링(Content-based Filtering)

콘텐츠 기반 필터링은 말 그대로 콘텐츠 정보를 기반으로 다른 콘텐츠를 추천하는 방식이다. 예를 들어 넷플릭스의 영화 콘텐츠라면 영화의 줄거리, 등장 배우와 장르 등을 데이터화 하고 분석하여 추천한다. 초기에 사용자의 행동 데이터가 적더라도 콘텐츠를 기반으로 분석하기 때문에
추천이 가능하다.

2. 협업 필터링(Collaborative Filtering)

협업 필터링은 많은 사용자로부터 얻은 기호 정보에 따라 사용자들의 관심사를 예측한다. 같은 행동을 한 사람들을 하나의 프로파일링으로 그룹핑하여, 그룹 내의 사람들이 공통으로 봤던 콘텐츠를 추천한다. 예를 들어 쇼핑몰에서 상품을 구매하면 해당 상품을 구매한 사람들이 구매한 다른 상품들을 추천 상품으로 보여주는 것에 이용한다. 콘텐츠 기반 추천 알고리즘과는 달리, 사용자 간의 데이터가 중요하기 때문에 기존 데이터가 없는 신규 사용자에게는 추천이 힘들다. 또한, 다수의 사용자가 관심을 보이는 소수의 콘텐츠가 전체 추천 콘텐츠로 보이는 비율이 높아져 소외되는 콘텐츠가 생긴다는 단점이 있다.

출처 : https://m.blog.naver.com/with_msip/221870532849 을 참고하였습니다.

CF 추천 알고리즘 구현 코드 : https://proinlab.com/archives/2103

profile
하지만 저는 이겨냅니다. 김서영이죠?

0개의 댓글