-쉽게 변화시킬 수 있다.
-실제 중요한 숫자들과 크게 상관이 없다
-근데 이 지표를 다른 사람들에게 이야기하면, 열심히 일하는 것 처럼 어필 가능
-의미가 없는것은 아님
-대표적인 예) 다운로드 수/ install수/ pageview/ 고객문의 처리 건수/ 버그개수..등
CPC가 50원인 채널과 200원인 채널이 있다면, 광고비를 어떻게 써야 할까?
1) 50원인 채널에 몰빵
2) 50원인 채널에 많이 넣고, 200원 채널에 조금 넣는다.
3) 이걸로는 결정할 수 없다.
[1] 클릭의 가치가 서로 다르기 때문
ㄴ 광고 집행은 AD-Network에 하지만, 어떤 매체에 집행되는지, 지면이 어떤 형태인지 알아야 하는 이유
[2] 집행하는 광고비 금액이 커지면, cpc는 높아지는게 일반적
ㄴ Targeting 기준이 완화되기 때문
ㄴ 광고 매체에서는 기본적으로 최적화를 해 주지만, 그 최적화가 내 서비스의 profit 최적화는 아니라는게 함정
ㄴ 전체 기준에 맞는 최적화 인가?를 항상 염두
ㄴ 꼭 광고에만 해당되는 것은 아님
ㄴ 실험 결과는 좋은데, 크로스셀rate은 왜 떨어지지?
-각 지표는 개선되었는데, 전체 지표는 오히려 감소?
-크로스셀이 높은 '일본' 지역의 비중이 지난달 대비 급감
-그러다보니 크로스셀이 높게 나오는 비율이 떨어지면서 전체 비율이 떨어짐
[1] 평균 만능주의
ㄴ outlier를 고려하지 않고 전체 평균을 내버림
ㄴ 평균이 좋은 대표값인가? > 분포가 정규분포일 때는 그렇다..
ㄴ 고러 분포를 먼저 확인하자! 어떤 값을 대표로 쓸 지 결정할 수 있다. (중앙값, 최빈값 등)
ㄴ 평균보다 훨씬 안정적인 값은 사실 > Median(중앙값)
[2] EDA(탐색적 분석) 과정에서 데이터 시각화의 중요성
ㄴ 이 데이터가 어떻게 생겼는지
ㄴ 어떤 패턴을 보이는지
ㄴ 이상치는 무엇인지
ㄴ 데이터 특성 판단
ㄴ 데이터 수집과 전처리의 중요성
ㄴ 데이터를 얼마나 목적에 맞게 수집했는지 중요