- 거래이력 데이터
*SKU(Stock Keeping Unit) : 재고 관리를 위한 최소 단위 코드
| 컬럼명 | 내용 |
|---|---|
| FSN ID | 각 SKU의 고유 식별자 |
| Order Date | 주문이 이루어진 날짜 |
| Year/Month | 주문이 이루어진 연도 및 월 |
| Order ID | 각 주문의 고유 식별 번호 |
| Order Item ID | 동시에 두 가지 다른 제품을 주문할 때 시스템이 생성하는 두 개의 다른 주문 항목 ID |
| GMV | 상품의 총 판매 가치 또는 수익 = 총 거래액 |
| Gross Merchandise Value | |
| Units | 특정 제품이 판매된 단위 수 |
| deliverybdays | 주문이 이루어진 날짜와 최종 배송일 사이의 영업일 수 |
| deliverycdays | 주문이 이루어진 날짜와 최종 배송일 사이의 달력 일 수 |
| Order Payment Type | 지불이 이루어진 방법(선불 또는 대금 상환) |
| SLA | 제품을 배달하는 데 일반적으로 걸리는 일 수 |
| Cust id | 고객의 고유 식별자 |
| pincode | 주문이 이루어진 위치의 핀 코드 |
| product_analytic_super_category | 제품이 속한 슈퍼 카테고리 |
| product_analytic_category | 제품이 속한 카테고리 |
| product_analytic_sub_category | 제품이 속한 하위 카테고리 |
| product_analytic_vertical | 제품이 속한 최대 하위 분류 |
| Product MRP | 제품의 최대 소매 가격 |
| Product procurement SLA | 제품을 조달하는 데 일반적으로 걸리는 시간 |
| 컬럼명 | 내용 |
|---|---|
| FSN ID | 각 SKU의 고유 식별자 |
| Order Date | 주문이 이루어진 날짜 |
| Year/Month | 주문이 이루어진 연도 및 월 |
| Order ID | 각 주문의 고유 식별 번호 |
| Order Item ID | 동시에 두 가지 다른 제품을 주문할 때 시스템이 생성하는 두 개의 다른 주문 항목 ID |
| GMV | 상품의 총 판매 가치 또는 수익 = 총 거래액 |
| Gross Merchandise Value | |
| Units | 특정 제품이 판매된 단위 수 |
| deliverybdays | 주문이 이루어진 날짜와 최종 배송일 사이의 영업일 수 |
| deliverycdays | 주문이 이루어진 날짜와 최종 배송일 사이의 달력 일 수 |
| Order Payment Type | 지불이 이루어진 방법(선불 또는 대금 상환) |
| SLA | 제품을 배달하는 데 일반적으로 걸리는 일 수 |
| Cust id | 고객의 고유 식별자 |
| pincode | 주문이 이루어진 위치의 핀 코드 |
| product_analytic_super_category | 제품이 속한 슈퍼 카테고리 |
| product_analytic_category | 제품이 속한 카테고리 |
| product_analytic_sub_category | 제품이 속한 하위 카테고리 |
| product_analytic_vertical | 제품이 속한 최대 하위 분류 |
| Product MRP | 제품의 최대 소매 가격 |
| Product procurement SLA | 제품을 조달하는 데 일반적으로 걸리는 시간 |
- 광고 및 투자 내역
아마 각 항목에 들인 비용으로 추정
| 컬럼명 | 내용 |
|---|---|
| Year/Month | |
| Total Investment | 각 광고/투자에 들인 비용의 합계 |
| TV | |
| Digital | |
| Sponsorship | |
| Content marketing | |
| Online marketing | |
| Affiliates(계열사) | |
| SEM(검색 엔진 마케팅) | |
| Radio | |
| Other |
<NPS_Stockindex> NPS(고객충성도 지표), Stock Index(주가 지수) 정보 - 2values
| 컬럼명 | 내용 |
|---|---|
| index | |
| July~June ’15 | 매달 15일에 대한 NPS와 Stock Index |
<Special_Sale_Calendar>마케팅 프로모션 기간 정보
| 컬럼명 | 내용 |
|---|---|
| 2015, 2016 | 마케팅 이루어진 기간 |
[투두]
각자 EDA 간단하게 하기
프로모션을 중심으로 기획서 써오기 (다음 회의에 준비) (ex. 프로모션을 했을 때 00에 대한 기대효과)
| 내용 | ||
|---|---|---|
| 주제 | 고객획득비용(CAC) 분석을 통한 광고 전략 최적화 | |
| 입력데이터 | '각 SKU의 고유 식별자', '주문 날짜', '주문 연도 및 월', '주문 고유 식별 번호', '동시에 두 가지 제품을 주문할 때 두 개의 다른 주문 항목 ID', '제품 판매 수익', '제품 판매 수', ‘지불 방법', '고객 고유 식별자', '주문 위치', '슈퍼 카테고리', '카테고리', '하위 카테고리', '최대 하위 분류', '최대 소매 가격' (: 배송일 관련 다 날림) | |
| 월별 매체별 투자비 내역 | ||
| 출력데이터 | 매출(gmv), 고객만족(nps), 재구매율, 전환율 | 재구매율 ≠ 전환율 ?? |
| 내용 | 기업은 고객획득비용을 분석해 얼마나 광고비를 사용해야 하는지 견적을 낼 수 있습니다. 우리는 여기서 한발 더 나아가 4가지 지표에 가장 많이 기여하는 고객들에게 최적화된 광고 전략을 세우고자 합니다. | |
| 광고 전략 최적화를 통해 다음 두가지 효과를 기대할 수 있습니다. 첫째, 우리 회사의 4가지 지표에 기여도가 높은 고객들에 대한 인사이트를 얻을 수 있습니다. 둘째, 적은 비용을 사용하고 최대의 효과로 효율적인 광고를 진행할 수 있습니다. | ||
| 제품 카테고리별 획득비용 |
제품 카테고리별 효과가 좋은 광고 매체
제품 카테고리별 (4가지 지표)와 연결
-> (4가지 지표 중 1개)에 기여가 가장 큰 카테고리는?
-> (4가지 지표 중 1개)에 기여가 가장 큰 광고 전략은? | |
gmv 한번에 그냥 바꾸면 된다고..? ㅇ0ㅇ
데이터를 좀더 봤으면 좋았을 것
“고객획득비용(CAC)분석을 통한 광고 전략 최적화”:주제
2차 피드백 12/10 (under2주)
취업
2조
daily GMV, Average Daily GMV, Promotino Days
조금씩 알아봐나가는 단계
7-9월은 데이터가 많지 X
고객,제품에 대한 RFM 분석. (+다른 지표를 가져와서 추가분석)
프로모션, 광고/투자 요인 등 중첩되는 요인에 있어서 각각 보면서 스토리텔링을 해 나가는 것 중요
추후에 가정이 필요할수도
focus를 조달기간에 둔다면 이상값 컬럼 날리는 것 O
but 다른 것에 주목한 분석이라면 굳이 날릴 필요는 없음 - 그러면 데이터가 뭉게지기 때문
나의 주요대상이 아니라면 preprocessing할 필요 없음
<이 데이터에서는 배달관련 이야기 안하는 것이 좋겠따 ..>
| 내용 | ||
|---|---|---|
| 주제 | 고객획득비용(CAC) 분석을 통한 광고 전략 최적화 | |
| 입력데이터 | '각 SKU의 고유 식별자', '주문 날짜', '주문 연도 및 월', '주문 고유 식별 번호', '동시에 두 가지 제품을 주문할 때 두 개의 다른 주문 항목 ID', '제품 판매 수익', '제품 판매 수', ‘지불 방법', '고객 고유 식별자', '주문 위치', '슈퍼 카테고리', '카테고리', '하위 카테고리', '최대 하위 분류', '최대 소매 가격' (: 배송일 관련 다 날림) | |
| 월별 매체별 투자비 내역 | ||
| 출력데이터 | 매출(gmv), 고객만족(nps), 재구매율, 전환율 | 재구매율 ≠ 전환율 ?? |
| 내용 | 기업은 고객획득비용을 분석해 얼마나 광고비를 사용해야 하는지 견적을 낼 수 있습니다. 우리는 여기서 한발 더 나아가 4가지 지표에 가장 많이 기여하는 고객들에게 최적화된 광고 전략을 세우고자 합니다. | |
| 광고 전략 최적화를 통해 다음 두가지 효과를 기대할 수 있습니다. 첫째, 우리 회사의 4가지 지표에 기여도가 높은 고객들에 대한 인사이트를 얻을 수 있습니다. 둘째, 적은 비용을 사용하고 최대의 효과로 효율적인 광고를 진행할 수 있습니다. | ||
| 제품 카테고리별 획득비용 |
제품 카테고리별 효과가 좋은 광고 매체
제품 카테고리별 (4가지 지표)와 연결
-> (4가지 지표 중 1개)에 기여가 가장 큰 카테고리는?
-> (4가지 지표 중 1개)에 기여가 가장 큰 광고 전략은? | |
슈퍼 카테고리 = 1가지
하위 카테고리 3단계 - 5개/ 14개/ 74개
뭘 봐야할까?
지표 구하기
매출 = sum(gmv)
고객만족 = nps - 세부사항은 알 수 없음
재구매율 = 2번이상 구매 고객 수 / 전체 고객 수
전환율
유입 수를 모르는데 전환율을 구할 수 있는가 ???
달 기준으로 전 달, 이후달 과 비교해보아도 좋을듯 ??
보통 기준으로 잡는 수치 = 64%
k가 필요한 것은 아니고 min pieces 조절하면서
dbscan 공부 - minpieces, depcilon 파라미터 조절
최적의 클러스터 몇개 찾아서 . 전부 할 필요는 없음
scaler쓰는 것 유념
clustering - distance 구하는 것 중요
https://scikit-learn.org/stable/modules/clustering.html 공부해봐
질문
발표
12.27금 9:30pm : 5-10min 발표
팀별 todolist
제품에 대한 재구매율
= 같은 제품에 대하여 고객별 첫주문을 제외한 주문건수 / 전체 주문건수
고객 기준 재구매율
=
클러스터링 결과
중분류 카테고리 EDA 결과 지표값이 높은 Top3 카테고리로 드릴다운하여 EDA 및 클러스터링
GMV - 'Camera', 'Speaker', 'CameraAccessory’
| 군집8 | 군집7 | 군집0 |
|---|---|---|
| GMV 가장 높음 | ||
| MobileSpeaker-Radio | LaptopSpeaker-Radio | DSLR-Radio |
| MobileSpeaker-Contentmarketing | LaptopSpeaker-Contentmarketing | DSLR-ContentMarketing |
| MobileSpeaker-Other | LaptopSpeaker-TV | |
| MobileSpeaker-TV | LaptopSpeaker-Other |
(MobileSpeaker, LaptopSpeaker, DSLR)에 대하여 (Radio, ContentMarketing) 광고
1M투자할 경우 고객당 매출이 5.07M 오를 것으로 예상
ROAS = 광고로 창출된 수익(전환 매출) /광고비 = 5.07
*원가를 알 수 있는 데이터가 있었으면 ROI를 추가로 분석함으로 장기적인 관점에서 전략수립이 가능하였을 것
재구매율- 'Game', 'CameraAccessory', 'Speaker’
| 군집13 | 군집11 | 군집10 |
|---|---|---|
| 재구매율 가장 높음 | CAC 가장 낮음 | |
| PhysicalGame-Radio | MobileSpeaker-Radio | LaptopSpeaker-Radio |
| PhysicalGame-ContentMarketing | MobileSpeaker-Contentmarketing | LaptopSpeaker-Contentmarketing |
| MobileSpeaker-Other | LaptopSpeaker-TV | |
| MobileSpeaker-TV | LaptopSpeaker-Other |
두 카테고리 모두 기존 재구매율이 17%로 높음(MobileSpeaker, LaptopSpeaker, PhysicalGame)에 대하여 (Radio, ContentMarketing) 광고
1M투자할 경우 고객당 재구매율이 0.05% 오를 것으로 예상 — 유의미한가?
ASP- 'Camera', 'GamingConsole', 'HomeAudio’
| 군집0 | 군집2 | 군집8 |
|---|---|---|
| ASP 가장 높음 | CAC 가장 낮음 | |
| DSLR-Radio | Point&Shoot-Radio | HomeAudioSpeaker-Radio |
| DSLR-ContentMarketing | Point&Shoot-Contentmarketing | HomeAudioSpeaker-Contentmarketing |
(DSLR, Point, HomeAudioSpeaker)에 대하여 (Radio, ContentMarketing) 광고
1M투자할 경우 고객1명이 소비하는 제품당 평균판매가격이 270달러 오를 것으로 예상
매출대비 수익률- 'GamingAccessory', 'AudioMP3Player', 'Speaker’
| 군집0 | 군집2 | 군집1 |
|---|---|---|
| 수익률 가장 높음 | ||
| AudioMP3Player-Radio | MobileSpeaker-Radio | LaptopSpeaker-Radio |
| AudioMP3Player-ContentMarketing | MobileSpeaker-Contentmarketing | LaptopSpeaker-Contentmarketing |
| MobileSpeaker-Other | LaptopSpeaker-TV | |
| MobileSpeaker-TV | LaptopSpeaker-Other |
(MobileSpeaker, LaptopSpeaker, AudioMP3Player)에 대하여 (Radio, ContentMarketing) 광고
1M투자할 경우 고객당 매출대비 수익률이 0.2% 오를 것으로 예상
⇒⇒⇒⇒⇒⇒
DBSCAN→ 가우시안 모델로 클러스터링 모델 수정
클러스터링 결과
중분류 카테고리 EDA 결과 지표값이 높은 Top3 카테고리로 드릴다운하여 EDA 및 클러스터링
GMV - 'Camera', 'Speaker', 'CameraAccessory’

| 군집2 | 군집6 |
|---|---|
| GMV 가장 높음 | |
| MobileSpeaker-Radio | DSLR-Radio |
| LaptopSpeaker-Radio | DSLR-Contentmarketing |
| MobileSpeaker-Contentmarketing | |
| LaptopSpeaker-Contentmarketing | |
| Point&Shoot-Radio |
(MobileSpeaker, LaptopSpeaker, DSLR)에 대하여 (Radio, ContentMarketing) 광고
1M투자할 경우 1855명의 고객이 유입될 것이며, 17.1M의 매출이 상승할 것이다.
*원가를 알 수 있는 데이터가 있었으면 ROI를 추가로 분석함으로 장기적인 관점에서 전략수립이 가능하였을 것
재구매율- 'Game', 'CameraAccessory', 'Speaker’

| 군집7 | 군집4 |
|---|---|
| 재구매율 가장 높음 | CAC 가장 낮음 |
| PhysicalGame-Radio | MobileSpeaker-Radio |
| PhysicalGame-ContentMarketing | MobileSpeaker-Contentmarketing |
| Lens-Radio | |
| MobileSpeaker-Other |
**1M투자할 경우 43명의 신규고객이 유입될 것이며, 현재 고객당 재구매율 대비 8.5% 높은 재구매율을 가질 것이다.** (MobileSpeaker, PhysicalGame)에 대하여 (Radio, ContentMarketing) 광고
1M투자할 경우 993명의 신규고객이 유입될 것이며, 현재 고객당 재구매율 대비 8.5% 높은 재구매율을 가질 것이다.
ASP- 'Camera', 'GamingConsole', 'HomeAudio’

| 군집2 | 군집0 |
|---|---|
| ASP 가장 높음 | |
| DSLR-Radio | Point&Shoot-Radio |
| DSLR-ContentMarketing | Point&Shoot-Contentmarketing |
| GamingConsole-Radio | |
| DSLR-Other | |
| DSLR-TV |
(DSLR, Point&Shoot)에 대하여 (Radio, ContentMarketing) 광고
1M투자할 경우 252명의 신규고객이 유입될 것이며, 신규고객이 제품 1개씩 구매하였을 경우, 평균금액에 따르면 약 5M의 매출이 예상됨
| 군집1 |
|---|
| CAC 가장 높음 |
| SlingBox-Other |
| SlingBox-Radio |
| SlingBox-ContentMarketing |
| HomeAudioSpeaker-Radio |
| HomeAudioSpeaker-ContentMarketing |
(SlingBox, HomeAudioSpeaker)에 대하여 (Radio, ContentMarketing) 광고
1M투자할 경우 3228명의 신규고객이 유입될 것이며, 신규고객이 제품 1개씩 구매하였을 경우, 평균금액에 따르면 약 11M의 매출이 예상됨
매출대비 수익률- 'GamingAccessory', 'AudioMP3Player', 'Speaker’


| 군집6 | 군집2 |
|---|---|
| CAC 가장 낮음 | |
| MobileSpeaker-Radio | AudioMP3Player-Radio |
| LaptopSpeaker-Radio | AudioMP3Player-Contentmarketing |
| LaptopSpeaker-Contentmarketing | |
| MobileSpeaker-Contentmarketing |
(MobileSpeaker, LaptopSpeaker, AudioMP3Player)에 대하여 (Radio, ContentMarketing) 광고
1M투자할 경우 2750명의 신규 고객이 유입될 것이며, 해당 군집 대상으로 현재 평균 수익률 대비 5.6% 높은 수익률을 보일 것으로 예상됨
| 군집1 |
|---|
| 수익률 가장 높음 |
| SpeakerEtc-Radio |
| SpeakerEtc-ContentMarketing |
| SpeakerEtc-Other |
| GamingSpeaker-Radio |
| SpeakerEtc-Digital |
| SpeakerEtc-TV |
SpeakerEtc에 대한 광고 - 대체적으로 높은 수익률을 보일 것으로 나타나지만,
해당 카테고리는 전처리 시 결측값을 대체한 것이므로 인사이트로부터 제외
⇒⇒⇒⇒⇒⇒
<정리>
GMV - (MobileSpeaker, LaptopSpeaker, DSLR)에 대하여 (Radio, ContentMarketing) 광고
1M투자할 경우 1855명의 고객이 유입될 것이며, 17.1M의 매출이 상승할 것이다.
재구매율 - (MobileSpeaker, PhysicalGame)에 대하여 (Radio, ContentMarketing) 광고
1M투자할 경우 993명의 신규고객이 유입될 것이며, 해당 군집 대상으로 현재 고객당 재구매율 대비 8.5% 높은 재구매율을 보일 것으로 예상
**1M투자할 경우 43명의 신규고객이 유입될 것이며, 해당 군집 대상으로 현재 고객당 재구매율 대비 8.5% 높은 재구매율을 보일 것으로 예상**ASP - (DSLR, Point&Shoot)에 대하여 (Radio, ContentMarketing) 광고
1M투자할 경우 252명의 신규고객이 유입될 것이며, 신규고객이 제품 1개씩 구매하였을 경우, 평균금액에 따르면 약 5M의 매출이 예상됨
1M투자할 경우 3228명의 신규고객이 유입될 것이며, 신규고객이 제품 1개씩 구매하였을 경우, 평균금액에 따르면 약 11M의 매출이 예상됨
수익률 - (MobileSpeaker, LaptopSpeaker, AudioMP3Player)에 대하여 (Radio, ContentMarketing) 광고
1M투자할 경우 2750명의 신규 고객이 유입될 것이며, 해당 군집 대상으로 현재 평균 수익률 대비 5.6% 높은 수익률을 보일 것으로 예상됨