250122 TIL #596 AI Tech #128 P: EDA 진행 - 3

김춘복·2025년 1월 22일
0

TIL : Today I Learned

목록 보기
598/604

Today I Learned

오늘도 EDA!


watching_status별 rating

  • 전체 watching_status 분포
  • 전체 rating 분포
  • 통계값 0포함, 0제외 비교
통계지표0점 포함0점 제외
count109,224,74762,397,712
mean4.245727.43196
std3.912891.76656
min0.000001.00000
25%0.000007.00000
50%5.000008.00000
75%8.000009.00000
max10.0000010.00000
  • watching_status별 rating 분포
  • watching_status 별 rating 비율 분포(0제외)

watching_status별 분석

  • ws1 : Currently Watching 상태
  • ws2: Completed 상태
  • ws3: On Hold 상태
  • ws4: Dropped 상태
  • ws6: Plan to Watch 상태

결론

  • watching-status가 dropped인 rating과 1~5값인 rating은 interaction 0으로 취급

  • 그 외 값들은 interaction 1로 취급

  • test를 1인당 10개의 rating으로 구성하기 위해 10개 이하의 rating을 가진 유저는 제거

  • negative / positive sampling
    positive 하나당 아이템 4개씩 negative sampling

profile
Backend Dev / Data Engineer

0개의 댓글