본 포스팅은 Fastcampus 강의를 수강하며 일부 내용을 정리한 글임을 밝힙니다. 보다 자세한 내용은 아래 강의를 통해 확인해주세요.
참고 : Fastcampus 딥러닝을 활용한 추천시스템 구현 올인원 패키지 Online
Ch 06. Model-based Collaborative Filtering
주어진 데이터들만 이용하여 학습 가능하였는데, 이러한 데이터는 얻기가 매우 제한적이고 추가 정보를 데이터로 넣어주면 훨씬 성능 향상 기대할 수 있음
- Explicit feedback: 설문조사, 평가, 피드백
- Implicit feedback: 웹페이지 머무는 시간, 클릭 패턴, 검색 로그 등
Explicit Feedback
- Item i에 대한 User u의 직접적인 생각, 취향, 선호도
- 대표적 예시: 영화/드라마 평점, 상품 구매 후기/평점
Implicit Feedback
- 플랫폼에서 얻을 수 있는 모든 데이터
- User u의 선호도 및 취향을 정확히 파악할 수 없지만 그럴듯한 추론 가능
- 데이터 자체의 품질은 좋지 않지만(정확한 선호도를 드러낸 것은 아니기때문에), 데이터 얻을 수 있는 방법 다양
- 사용자 로그 분석, 검색 기록, 클릭여부
- 웹페이지 스크롤, 머무르는 시간
- 실제 구매 여부, 장바구니 등
Explicit vs. Implicit Feedback
Explicit Feedback
장점
단점
- 데이터 구하기 어려움
- 평가된 유저의 데이터를 신뢰하기 어려움
- 평가에 대한 심리적 거부감, 귀찮음 등으로 모든 유저가 전부 참여하지 않음
Implicit Feedback
장점
단점
- 데이터의 실제 의미 파악 어려움
- 노이즈 or 결측값 존재
- 부정적인 피드백 얻기 어려움
- 선호도 파악이 아닌 유저의 행동에 대한 가중치 또는 신뢰도로 파악 가능
- 좋아하는지 안 하는지에 대한 판단은 못하고, 그 아이템의 선호도 가중치와 신뢰도로 활용
- 데이터 품질에 대한 평가 기준이 불분명함