First Analysis theory
눈에 띄는 점을 확대해서 살펴보기
지난 트렌드 분석에서 11월 22일, 11월 28일에서 방문, 매출 등이 다른 날에 비해 높게 나타났고, 12월 31일이 다른 날에 비해 급격히 감소하는 현상을 발견했다.
11월 22일 | 11월 28일 | 12월 31일 | |
---|---|---|---|
데이터 총 갯수 | 270,074 | 224,940 | 31,096 |
distinct users | 24,276 | 23,683 | 7,430 |
unique user_count | 48,481 | 44,252 | 10,370 |
view | 111,247 | 95,786 | 17,216 |
cart | 81,387 | 66,940 | 7,063 |
remove_from_cart | 54,660 | 45,240 | 5,691 |
purchase | 22,780 | 16,974 | 1,126 |
*user 단계에서 파악해본다.
날짜 | cart / veiw | remove / cart | purchase / cart | purchase / view |
---|---|---|---|---|
11월 22일 | 0.3967 | 0.5988 | 0.2606 | 0.1034 |
11월 28일 | 0.3442 | 0.6208 | 0.2497 | 0.0859 |
12월 31일 | 0.1528 | 0.5362 | 0.1677 | 0.0256 |
▶️ 전환율을 확인했을 때 12월 31일에서 cart/view
와 purchase/cart
의 값이 11월 값보다 2배 정도 낮은 것을 확인했다.
purchase/view
전환율의 경우 약 5배 수치가 낮았다.
▶️ 특정 날짜에 구매자가 현재 특정한 날짜 (11월 22일, 11월 28일, 12월 31일)에도 구매했는지를 확인했고, 특정날짜를 포함한 모든 날짜에 재구매한 유저의 수를 확인하였다.
▶️ 해당 일자 총 구매자의 절반 정도가 재구매한 이용자이다.
다른 날짜에도 구매한 user
셀의 값과 똑같은 값이 나온다.▶️ 전반적으로 구한 비율의 값에서 눈에 띄게 다른 점을 찾지 못하였다.(비슷한 퍼센트를 보인다)
▶️ (의문점) 전환율에서는 차이가 있었으나 리텐션의 차이는 없었다.
처음에 마케팅으로 인해 들어오기만 한 사람들이 많아서 view 값만 뛴 것이 아니었을까 가설을 세웠는데, 그 부분은 사실이 아님을 확인하였다. 12월 31일 구매자들도 리텐션에서 특이점이 없었다. 그렇다면 어떤 것이 전환율에서 차이를 만들어 낸 것일까?
1)어떤 유저는 view를 많이 하고 purchase 를 하고,
2)어떤 유저는 view 를 적게 하고 purchase를 많이 할 것일까?
#### 특정 일자에서 두 그룹으로 나눠서 어떤 차이가 있는지 분석
-- 세팅
-- purchase가 view보다 많은 user_id
create temporary table p as
select user_id
, count(case when event_type = 'view' then user_id else null end) as views
, count(case when event_type = 'purchase' then user_id else null end) as purchases
from Nov22th
group by user_id
having views < purchases;
-- view가 purchase보다 많은 user_id
create temporary table v as
select user_id
, count(case when event_type = 'view' then user_id else null end) as views
, count(case when event_type = 'purchase' then user_id else null end) as purchases
from Nov22th
group by user_id
having views >= purchases;
avg(views)/count(*) * 100
> 지금 의미가 있나?구매자 유형 | purchases > views | purchases =< views |
---|---|---|
11월 22일 | 0.3729 | 0.0199 |
11월 28일 | 0.4234 | 0.0178 |
12월 31일 | 2.0226 | 0.0316 |
second analysis theory
10월 2일과 6일 view와 cart가 크게 뛰었으나, purchase 값은 그대로였던 현상을 파악해서 어떤 유저가 그런 이상한 점을 발생시켰는지를 파악해본다.
날짜 | cart / veiw | remove / cart | purchase / cart | purchase / view |
---|---|---|---|---|
10월 2일 | 0.6716 | 0.1190 | 0.0472 | 0.0317 |
10월 6일 | 0.6354 | 0.1225 | 0.0428 | 0.0272 |
11월 22일 | 0.3967 | 0.5988 | 0.2606 | 0.1034 |
▶️ 카트에 넣은 비율이 월등히 높고, remove_from_cart
나 purchase
한 비율이 매우 적음 > 그래프에서 확인한 사실
* 유저 레벨에서 왜 그런 지 파헤쳐야 하는데.. 어떻게?
액션을 유저레벨에서 어떻게 쪼개는 것일지
매출을 공식으로 쪼개는 것 cvr / arppu
액션을 유저레벨로 쪼개는 것
매출을 유저레벨로 쪼개는 것
-- mau 쿼리
select STR_TO_DATE(CONCAT(YEARWEEK(event_time, 0), ' Sunday'), '%X%V %W') as week_start
, ROUND(SUM(CASE WHEN event_type = 'purchase' THEN price ELSE 0 END),2) / count(distinct CASE WHEN event_type = 'purchase' THEN user_id END) AS avg value
from beauty_ecommerce
where event_type = 'purchase'
group by STR_TO_DATE(CONCAT(YEARWEEK(event_time, 0), ' Sunday'), '%X%V %W')
-- pu rate 구한 쿼리
SELECT
DATE_FORMAT(event_time, '%Y-%m-%d') as dt,
COUNT(DISTINCT CASE WHEN event_type = 'purchase' THEN user_id END) as purchase_user,
COUNT(DISTINCT user_id) as total_user,
COUNT(DISTINCT CASE WHEN event_type = 'purchase' THEN user_id END) / COUNT(DISTINCT user_id) as ratio
FROM
beauty_ecommerce
GROUP BY
DATE_FORMAT(event_time, '%Y-%m-%d');
-- ARPU average revenue per user
select user_id
, round(avg(price),2) as avg_expenses
FROM beauty_ecommerce
where event_type = 'purchase'
GROUP BY user_id;
-- 각가 비교해서 구하기
SELECT 'Nov22th' AS table_name, COUNT(DISTINCT user_id) AS unique_user_count
FROM Nov22th
UNION ALL
SELECT 'Nov28th' AS table_name, COUNT(DISTINCT user_id) AS unique_user_count
FROM Nov28th
UNION ALL
SELECT 'Dec31th' AS table_name, COUNT(DISTINCT user_id) AS unique_user_count
FROM Dec31th;
table_name unique_user_count
Nov22th 24276
Nov28th 23683
Dec31th 7430