25 Nov, 2021

wannabedatazzang·2021년 11월 25일
0

[Sol] Today I Learned

목록 보기
8/15

[인프런 Growth hacking]


retention 계산
MAU 1월 : 428 , 2월 800, 3월 1230 ...

user_id로 가입 달 정보를 가져옴.

달 마다 몇명의 유저가 구매를 하고 매출액이 얼마인지 구할 수 있음

가입자 : retention 계산을 위해 만들었던 걸로 달마다 가입자수 알 수 있음
잔존율 :
활동회원 : 현재 활동 회원
결제자수 :
ARPPU :
매출 : 매출액

[Hands on]

이상치 탐지 outlier detection : 부정 거래를 막기 위해 이상한 신용카드 거래를 감지, 제조 결함 감지, 학습 알고리즘에 주입하기 전에 데이터셋에서 이상한 값 자동으로 제거하는 것 등
특이치 탐지 novelty detection : 훈련 세트에 있는 모든 샘플과 달라 보이는 새로운 샘플을 탐지하는 것이 목적

하나의 값을 예측 : 단변량 회귀 univariate regression
여러 값을 예측 : 다변량 회귀 multivariate regression

데이터 스누핑 data snooping : 테스트 세트를 들여다본다면 테스트 세트에서 겉으로 드러난 어떤 패턴에 속아 특정 머신러닝 모델을 선택하게 될지도 모릅니다. 이 테스트 세트로 일반화 오차를 추정하면 매우 낙관적인 추정이 되며 시스템을 론칭했을 때 기대한 성능이 나오지 않을 것입니다.

0개의 댓글