retention 계산
MAU 1월 : 428 , 2월 800, 3월 1230 ...
user_id로 가입 달 정보를 가져옴.
달 마다 몇명의 유저가 구매를 하고 매출액이 얼마인지 구할 수 있음
가입자 : retention 계산을 위해 만들었던 걸로 달마다 가입자수 알 수 있음
잔존율 :
활동회원 : 현재 활동 회원
결제자수 :
ARPPU :
매출 : 매출액
이상치 탐지 outlier detection : 부정 거래를 막기 위해 이상한 신용카드 거래를 감지, 제조 결함 감지, 학습 알고리즘에 주입하기 전에 데이터셋에서 이상한 값 자동으로 제거하는 것 등
특이치 탐지 novelty detection : 훈련 세트에 있는 모든 샘플과 달라 보이는 새로운 샘플을 탐지하는 것이 목적
하나의 값을 예측 : 단변량 회귀 univariate regression
여러 값을 예측 : 다변량 회귀 multivariate regression
데이터 스누핑 data snooping : 테스트 세트를 들여다본다면 테스트 세트에서 겉으로 드러난 어떤 패턴에 속아 특정 머신러닝 모델을 선택하게 될지도 모릅니다. 이 테스트 세트로 일반화 오차를 추정하면 매우 낙관적인 추정이 되며 시스템을 론칭했을 때 기대한 성능이 나오지 않을 것입니다.