매년 12월 31일은 우리가 흔히 얘기하는 연말의 절정이라고 할 수 있다.
하지만 연이은 사고 소식에 참사까지 일어나게 되면서 연례없는 가장 차분한 연말과 새해를 보낼듯 하다.
각종 매체를 통해 무안공항에서 일어난 안타까운 참사에 대해 접할것이라 예상한다.
그렇기에 길게 적지 않고 깊은 애도를 표하며 오늘의 글을 시작하려 한다.
너무 무거운 사진과 주제로 오늘 글을 시작한 것은 아닐까하는 노파심에 우리 귀여운 팀원들과 매니저님을 소개한다!!
'다들 캐릭터만 웃고 있는건 안비밀🤫'
분석 방법 순서
1. 내부 광고 CPC,CTR
- 제품별 box plot (노출, 클릭, 주문)
- 퍼널 (기기별, 제품별)
- 요일별 막대그래프
- 일별 원단위 분리표
- 고객 세그먼트
- RFM, 고객 행동%
- 내,외부 CTR/CVR별 CPC
이 중에 나는 제품별 box plot
box plot 예시는 다음과 같다
네모로 그려져 있는 것을 box
라고 하며
box 위.아래
는 각각 이 그룹의 25%, 75%를 나타낸다
즉, inside of box
= 25% ~ 75% 사이의 데이터를 나타내는 것이다
중간에 있는 굵은선
은 box(25% ~ 75%)의 중간치를 나타내는 선이다
box 밖으로 뻗어져 있는 선들의 끝
은 최댓값과 최솟값을 나타낸다
그외 점처럼 표시되어 있는 것들은 Outlier
로 한국말로 이상치
라고 한다
박스와 같은 라인에 존재하지 않고 그 밖에 따로 존재한다는 것이다
보통 이상치의 존재 유무나 여러 그룹의 대략적인 분포도를 보기에 좋아 이용한다
특히 이상치가 존재할 경우 이상치를 어떻게 처리할 것인지에 대해 생각하는 것이 중요하다
잠시 딴길로 새서 다시 돌아오자면, 제품별로 banner_show,banner_click,order 의 그룹을 나누어 box plot을 만드는 것이다.
CPC 단가 책정하는 회의를 약 2시간 정도 한 이후 각자 역할 분담하여 분석을 하던 중... 문제가 발생했다.
여기서 이상한점을 찾아보자!
답은 CTR에 비해 CVR이 너무 높다는 것이다.
다시 말해 배너 광고를 보고 클릭한 사람보다 배너 광고 클릭 후 구매한 사람이 많다는 말이다
하지만 상식적으로 생각해보자 보통의 배너 광고란 팝업과 비슷하지만 한자리에 고정되어 있다는 점만 다르고 소비자로 하여금 광고를 클릭하게 만드는 것이 배너 광고 아닌가?
그렇다면, 배너 광고를 본 사람이 제일 많아야 하고, 다음 클릭, 주문 순으로 사람이 많아야 하는 것 아닐까?
이 부분을 무시하고 지나갈 수 없었던것은 해당하는 데이터들을 어떻게 해야할지 결정하게 되면 데이터 전처리부터 다시 해야하는 일이 생기기 때문에 긴급회의에 들었갔다.
그러나 우리는 그저 주어진 데이터 안에서만 볼 수 있었고 , 아직 데이터에 대한 이해력이 부족할 수 있다고 판단하여 매니저님께 현 상황을 설명하고 도움을 청했다.
처음보는 데이터에 잠시 당황하셨다가 이내 몇가지를 물어보시고는 다음과 같이 대답해주셨다.
'어렵게 가고 싶지 않다면 기간내에 있는 부분을 말고 배너를 클릭하거나 주문한건이 많아도 배너 광고의 영향이라고 생각해라'
혹은 '회의를 통해 배너광고가 영향을 미친다고 생각하는 기간을 정해 영향력을 분석해라' 라고 하셨다.
내부 회의로는 안끝날 문제라고 빠르게 판단하여 튜터님께 찾아가 다시 한번 도움을 요청했더니
'아직은 어려울 수 있으니 퍼널분석에서는 세가지 단계를 모두 만족한 사람들만 모아서 취합하기로 하고 그 외 다른 분석들에서는 전체 데이터를 다 포함하여 분석하기로 하자'라고 해주셨다.
큰 걸림돌이 해결되었지만 시간이 촉박해서 열심히 해야하는 일만 남았다..
내일 모레까지만 열심히 하자 화이팅..