[TIL] 실전프로젝트 1일차: 주제 선정 & ETA 작성

Donghyun·2024년 9월 9일
0

TIL (Today I Learned)

목록 보기
47/53

오늘의 목표

🚨
  1. 주제 선정
  2. ETA 작성

심화 프로젝트 종료 후 일주일 간 Tableau를 활용한 대시보드 제작 방법에 대해 공부한 뒤 오늘 드디어 실전 프로젝트가 시작됐다. 시간이 왜 이렇게 빨리 가는지… 시간이 야속하지만, 이번 프로젝트는 시각적인 요소가 주된 목표이다 보니 재밌는 프로젝트가 될 것 같다.

이번 프로젝트의 평가 항목은 다음과 같다:

주제 선정

팀원들과의 회의에서 아마존 데이터자유 주제(서울공공데이터) 이렇게 둘로 의견이 나뉘었다. 이후 추가적으로 얘기를 나눴는데, 자유 주제의 경우 우리가 조금 더 주도적으로 프로젝트를 진행할 수 있는 장점이 있지만, 아래와 같은 이유들로 아마존 데이터로 최종 선택을 했다.

주제: 아마존 데이터 속으로 떠나는 인사이트 모험

링크: https://teamsparta.notion.site/7feb0e96febc41fd8353f9c0860a08a6

주제 선정 이유:

고객 중심의 초개인화 시대에 발맞춰, 개별 고객의 특성과 선호도에 맞춘 맞춤형 서비스 제공이 기업의 성패를 좌우하는 중요한 요소가 되었습니다. 이러한 환경에서 훌륭한 데이터 분석가로 성장하기 위해서는 군집화, 시계열 예측, 상품 포트폴리오 최적화 등의 경험이 필수적이다.

아마존의 방대한 판매 및 고객 데이터는 이러한 경험을 충족시킬 수 있는 훌륭한 자료라고 생각되며, 또한 Tableau를 활용해 데이터를 효과적으로 시각화함으로써, 이러한 인사이트를 경영진과 마케터들이 쉽게 이해하고 빠르게 의사결정을 내릴 수 있도록 돕는 경험을 쌓을 수 있을 것이라고 사료되어 해당 주제를 선정하게 됐다.

프로젝트 명:

Tableau를 활용한 amazon 매출 증진 프로젝트

프로젝트 목표:

아마존의 매출 및 판매 데이터 분석을 통해 주요 트렌드를 파악하고, 데이터 기반의 비즈니스 전략 수립에 기여하며, 대시보드를 통해 마케팅, 운영, 상품 관리 등 다양한 이해관계자가 쉽게 인사이트를 얻을 수 있도록 돕는다.

프로젝트 핵심 내용:

  1. 데이터 준비 및 정제
    • 결측치, 이상치, 스케일링, 인코딩
  2. 목적에 맞는 분석 방법 선택
    • 판매 트렌드 분석
    • 고객 분석
    • 상품 성과 분석
  3. 결과 시각화 및 Tableau 활용한 대시보드 제작

주요 지표 후보

KPI

  • 매출 성장 및 고객 분석을 통한 비즈니스 전략 수립
    • YoY, MoM, 상품별 매출 기여도, 주요 고객 매출 기여도

매출 총액(Total Sales Amount)

  • 모든 거래의 총 매출액을 합산한 값 → 특정 기간 동안의 매출 성과 평가
  • 사용되는 컬럼: Sales Amount

총 판매량(Total Sales Quantity)

  • 모든 거래에서 판매된 총 상품 수량
  • 사용되는 컬럼: Sales Quantity

평균 주문 금액(Average Order Value)

  • 각 주문의 평균 매출 금액 → 고객당 평균 구매 금액 파악
  • 사용되는 컬럼: Sales Amount, Order Number

할인율 (Discount Rate)

  • 각 거래에서 제공된 평균 할인율 → 할인 전략(마케팅)의 효과 분석?
  • 사용되는 컬럼: List Price, Sales Price

마진율 (Profit Margin)

  • 판매 마진이 어느 정도인지 파악 → 수익 분석
  • 사용되는 컬럼: Sales Margin Amount, Sales Amount

상위 고객 비율 (Top Customers Contribution)

  • 상위 고객들이 전체 매출에서 차지하는 비율 → 파레토의 법칙 적용 하여 효과적인 고객 관리 전략 수립?
  • 사용되는 컬럼: Custkey, Sales Amount

상품 판매 빈도 (Product Sales Frequency)

  • 특정 상품이 판매된 빈도 계산 → 인기 상품 분석
  • 사용되는 컬럼: Item Number, Sales Quantity

N-day Retention

  • 최초 사용일로부터 N일 후에 재방문한 액티브 유저의 비율을 측정 → 고객 충성도 평가?
  • 사용되는 컬럼: Custkey, Order Number, DateKey

시계열 매출 변화율

  • 특정 기간 동안의 매출 증가 또는 감소 비율 분석 → 성장 추세 파악
  • YTD, YoY, QoQ, MoM, WoW 등등
  • 사용되는 컬럼: Sales Amount, DateKey

프로젝트 방향성

Tableau 를 활용한 시계열 분석과 파이썬 클러스터 모델을 활용해 고객 세분화를 한 뒤 이 두 결과를 믹스해 아마존의 매출을 증진시킬 수 있는 인사이트 및 액션플랜 도출

ETA 작성

이번 프로젝트에서도 전과 마찬가지로 효율적인 프로세스 관리를 위해 ETA를 작성했으며, 각각의 목차는 다음과 같다:

1. 주제 선정 (09.09)

2. ETA 작성 (09.09)

3. 탐색적 데이터 분석(EDA) (09.10)

3-1. 결측치 확인

3-2. 기본 통계량 확인

3-3. 시각화 및 결과 확인

4. 데이터 전처리 (09.10)

4-1. 결측치 처리

4-2. 이상치 처리

4-3. 스케일링

4-4. 인코딩

5. Tableau를 활용한 데이터 시각화 (09.11~13)

5-1. Tableau에 정제된 데이터 불러오기

5-2. 프로젝트 목적에 맞는 지표 선정 후 분담해서 시각화

5-3. 고객 세분화

5-4. 시각화 결과 분석 및 인사이트 도출

6. 대시보드 제작 (09.13 - 09.18)

6-1. Figma 로 대시보드 스케치(09.13)

6-2. Tableau에서 대시보드 제작(09.18)

7. 발표준비 (09.19 - 20)

7-1. PPT 제작

7-2. 발표 영상 제작

내일 할 일

  1. 탐색적 데이터 분석(EDA)
  2. 데이터 전처리
profile
데이터분석 공부 일기~!

0개의 댓글