심화 프로젝트 종료 후 일주일 간 Tableau를 활용한 대시보드 제작 방법에 대해 공부한 뒤 오늘 드디어 실전 프로젝트가 시작됐다. 시간이 왜 이렇게 빨리 가는지… 시간이 야속하지만, 이번 프로젝트는 시각적인 요소가 주된 목표이다 보니 재밌는 프로젝트가 될 것 같다.
이번 프로젝트의 평가 항목은 다음과 같다:
팀원들과의 회의에서 아마존 데이터와 자유 주제(서울공공데이터) 이렇게 둘로 의견이 나뉘었다. 이후 추가적으로 얘기를 나눴는데, 자유 주제의 경우 우리가 조금 더 주도적으로 프로젝트를 진행할 수 있는 장점이 있지만, 아래와 같은 이유들로 아마존 데이터로 최종 선택을 했다.
링크: https://teamsparta.notion.site/7feb0e96febc41fd8353f9c0860a08a6
고객 중심의 초개인화 시대에 발맞춰, 개별 고객의 특성과 선호도에 맞춘 맞춤형 서비스 제공이 기업의 성패를 좌우하는 중요한 요소가 되었습니다. 이러한 환경에서 훌륭한 데이터 분석가로 성장하기 위해서는 군집화, 시계열 예측, 상품 포트폴리오 최적화 등의 경험이 필수적이다.
아마존의 방대한 판매 및 고객 데이터는 이러한 경험을 충족시킬 수 있는 훌륭한 자료라고 생각되며, 또한 Tableau를 활용해 데이터를 효과적으로 시각화함으로써, 이러한 인사이트를 경영진과 마케터들이 쉽게 이해하고 빠르게 의사결정을 내릴 수 있도록 돕는 경험을 쌓을 수 있을 것이라고 사료되어 해당 주제를 선정하게 됐다.
Tableau를 활용한 amazon 매출 증진 프로젝트
아마존의 매출 및 판매 데이터 분석을 통해 주요 트렌드를 파악하고, 데이터 기반의 비즈니스 전략 수립에 기여하며, 대시보드를 통해 마케팅, 운영, 상품 관리 등 다양한 이해관계자가 쉽게 인사이트를 얻을 수 있도록 돕는다.
KPI
YoY
, MoM
, 상품별 매출 기여도
, 주요 고객 매출 기여도
등매출 총액(Total Sales Amount)
Sales Amount
총 판매량(Total Sales Quantity)
Sales Quantity
평균 주문 금액(Average Order Value)
Sales Amount
, Order Number
할인율 (Discount Rate)
List Price
, Sales Price
마진율 (Profit Margin)
Sales Margin Amount
, Sales Amount
상위 고객 비율 (Top Customers Contribution)
Custkey
, Sales Amount
상품 판매 빈도 (Product Sales Frequency)
Item Number
, Sales Quantity
N-day Retention
Custkey
, Order Number
, DateKey
시계열 매출 변화율
Sales Amount
, DateKey
Tableau 를 활용한 시계열 분석과 파이썬 클러스터 모델을 활용해 고객 세분화를 한 뒤 이 두 결과를 믹스해 아마존의 매출을 증진시킬 수 있는 인사이트 및 액션플랜 도출
이번 프로젝트에서도 전과 마찬가지로 효율적인 프로세스 관리를 위해 ETA를 작성했으며, 각각의 목차는 다음과 같다:
1. 주제 선정 (09.09)
2. ETA 작성 (09.09)
3. 탐색적 데이터 분석(EDA) (09.10)
3-1. 결측치 확인
3-2. 기본 통계량 확인
3-3. 시각화 및 결과 확인
4. 데이터 전처리 (09.10)
4-1. 결측치 처리
4-2. 이상치 처리
4-3. 스케일링
4-4. 인코딩
5. Tableau를 활용한 데이터 시각화 (09.11~13)
5-1. Tableau에 정제된 데이터 불러오기
5-2. 프로젝트 목적에 맞는 지표 선정 후 분담해서 시각화
5-3. 고객 세분화
5-4. 시각화 결과 분석 및 인사이트 도출
6. 대시보드 제작 (09.13 - 09.18)
6-1. Figma 로 대시보드 스케치(09.13)
6-2. Tableau에서 대시보드 제작(09.18)
7. 발표준비 (09.19 - 20)
7-1. PPT 제작
7-2. 발표 영상 제작