SQL | 프로젝트 #2-2

소리·2024년 8월 11일
0

First Analysis theory

눈에 띄는 점을 확대해서 살펴보기

지난 트렌드 분석에서 11월 22일, 11월 28일에서 방문, 매출 등이 다른 날에 비해 높게 나타났고, 12월 31일이 다른 날에 비해 급격히 감소하는 현상을 발견했다.

🔍 그래서 이 날들의 데이터를 비교한다. 차이에서 유의미한 내용을 파악한다.

11월 22일11월 28일12월 31일
데이터 총 갯수270,074224,94031,096
distinct users24,27623,6837,430
unique user_count48,48144,25210,370
view111,24795,78617,216
cart81,38766,9407,063
remove_from_cart54,66045,2405,691
purchase22,78016,9741,126

*user 단계에서 파악해본다.


🔍 전환율이 어떤 차이가 있을까?

날짜cart / veiwremove / cartpurchase / cartpurchase / view
11월 22일0.39670.59880.26060.1034
11월 28일0.34420.62080.24970.0859
12월 31일0.15280.53620.16770.0256

▶️ 전환율을 확인했을 때 12월 31일에서 cart/viewpurchase/cart의 값이 11월 값보다 2배 정도 낮은 것을 확인했다.
purchase/view 전환율의 경우 약 5배 수치가 낮았다.


🔍 구매일자 별 이용자를 파악해보자

❓ 해당 날짜 구매자는 다른 날에도 샀을까?

▶️ 특정 날짜에 구매자가 현재 특정한 날짜 (11월 22일, 11월 28일, 12월 31일)에도 구매했는지를 확인했고, 특정날짜를 포함한 모든 날짜에 재구매한 유저의 수를 확인하였다.
▶️ 해당 일자 총 구매자의 절반 정도가 재구매한 이용자이다.


❓ 여러 날 구매했을까?

  • 2번 이상 구매한 사람도 전체 구매자 중 상위 12% 안에 든다.
  • 3번이상 구매한 사람은 상위 3%이다. 이 값은 다른 날짜에도 구매한 user 셀의 값과 똑같은 값이 나온다.
    ▶️ 3번 이상 산 사람을 고려한다


❓ 그 날 이후에 구매를 안한 사람들이 접속도 하고 쇼핑도 했는데 구매를 안할 걸까 접속을 안할걸까?


방문한 적이 있는 사람들은 어떤 행보를 보이나? 매출이 얼마나 되나? (매출차이를 왜 구한거지?)

▶️ 전반적으로 구한 비율의 값에서 눈에 띄게 다른 점을 찾지 못하였다.(비슷한 퍼센트를 보인다)
▶️ (의문점) 전환율에서는 차이가 있었으나 리텐션의 차이는 없었다.
처음에 마케팅으로 인해 들어오기만 한 사람들이 많아서 view 값만 뛴 것이 아니었을까 가설을 세웠는데, 그 부분은 사실이 아님을 확인하였다. 12월 31일 구매자들도 리텐션에서 특이점이 없었다. 그렇다면 어떤 것이 전환율에서 차이를 만들어 낸 것일까?


🔽🔍 더 깊게 들어가서

1)어떤 유저는 view를 많이 하고 purchase 를 하고,
2)어떤 유저는 view 를 적게 하고 purchase를 많이 할 것일까?

#### 특정 일자에서 두 그룹으로 나눠서 어떤 차이가 있는지 분석

-- 세팅

-- purchase가 view보다 많은 user_id

create temporary table p as
	select user_id
		, count(case when event_type = 'view' then user_id else null end) as views
		, count(case when event_type = 'purchase' then user_id else null end) as purchases
	from Nov22th
	group by user_id
	having views < purchases;


-- view가 purchase보다 많은 user_id

create temporary table v as
	select user_id
		, count(case when event_type = 'view' then user_id else null end) as views
		, count(case when event_type = 'purchase' then user_id else null end) as purchases
	from Nov22th
	group by user_id
	having views >= purchases;
    
  • avg(views)/count(*) * 100 > 지금 의미가 있나?
구매자 유형purchases > viewspurchases =< views
11월 22일0.37290.0199
11월 28일0.42340.0178
12월 31일2.02260.0316

second analysis theory

10월 2일과 6일 view와 cart가 크게 뛰었으나, purchase 값은 그대로였던 현상을 파악해서 어떤 유저가 그런 이상한 점을 발생시켰는지를 파악해본다.

❓ 10월 2일, 6일과 11월 22일의 차이는 무엇일까?

  • 전환율 파악
날짜cart / veiwremove / cartpurchase / cartpurchase / view
10월 2일0.67160.11900.04720.0317
10월 6일0.63540.12250.04280.0272
11월 22일0.39670.59880.26060.1034

▶️ 카트에 넣은 비율이 월등히 높고, remove_from_cartpurchase한 비율이 매우 적음 > 그래프에서 확인한 사실

* 유저 레벨에서 왜 그런 지 파헤쳐야 하는데.. 어떻게?

액션을 유저레벨에서 어떻게 쪼개는 것일지


매출을 공식으로 쪼개는 것 cvr / arppu
액션을 유저레벨로 쪼개는 것
매출을 유저레벨로 쪼개는 것


쿼리 저장

-- mau 쿼리

select STR_TO_DATE(CONCAT(YEARWEEK(event_time, 0), ' Sunday'), '%X%V %W') as week_start
, ROUND(SUM(CASE WHEN event_type = 'purchase' THEN price ELSE 0 END),2) / count(distinct CASE WHEN event_type = 'purchase' THEN user_id END) AS avg value
from beauty_ecommerce
where event_type = 'purchase'
group by STR_TO_DATE(CONCAT(YEARWEEK(event_time, 0), ' Sunday'), '%X%V %W')

-- pu rate 구한 쿼리

SELECT
DATE_FORMAT(event_time, '%Y-%m-%d') as dt,
COUNT(DISTINCT CASE WHEN event_type = 'purchase' THEN user_id END) as purchase_user,
COUNT(DISTINCT user_id) as total_user,
COUNT(DISTINCT CASE WHEN event_type = 'purchase' THEN user_id END) / COUNT(DISTINCT user_id) as ratio
FROM
beauty_ecommerce
GROUP BY
DATE_FORMAT(event_time, '%Y-%m-%d');

-- ARPU average revenue per user
select user_id
, round(avg(price),2) as avg_expenses
FROM beauty_ecommerce
where event_type = 'purchase'
GROUP BY user_id;

-- 각가 비교해서 구하기
SELECT 'Nov22th' AS table_name, COUNT(DISTINCT user_id) AS unique_user_count
FROM Nov22th
UNION ALL
SELECT 'Nov28th' AS table_name, COUNT(DISTINCT user_id) AS unique_user_count
FROM Nov28th
UNION ALL
SELECT 'Dec31th' AS table_name, COUNT(DISTINCT user_id) AS unique_user_count
FROM Dec31th;

table_name unique_user_count
Nov22th 24276
Nov28th 23683
Dec31th 7430

profile
데이터로 경로를 탐색합니다.

0개의 댓글