TIL(24.08.01.)

codataffee·2024년 8월 1일

TIL

목록 보기
115/135
post-thumbnail

#INTRO

벌써 8월???!!!?!?!?


#커머스 데이터 분석 실무 (라이브 세션)


#최종 프로젝트 진행


R, F, M 분류 결과

RECENCY
30일 이하 (1개월 이내 방문) = 5점
30일 ~ 90일 (3개월 이내 방문) = 4점
90일 ~ 180일 (6개월 이내 방문) = 3점
180일 ~ 365일 (1년 이내 방문) = 2점
365일 이상 (1년 이상 미방문) = 1점

FREQUENCY
104회 이상 (1주당 1회 방문) = 5점
35회 이상 (3주당 1회 방문) = 4점
12회 이상 (2개월당 1회 방문) = 3점
2회 이상 (1년당 1회 방문) = 2점
1회 이하 (재방문하지 않은 고객) = 1점

MONETARY
10 이상 = 5점 (2710명 → 전체 매출의 4.3 %)
5 이상 10 미만 = 4점 (15747명 →전체 매출의 11.9 %)
0.9 이상 5 미만 = 3점 (251289명 →전체 매출의 53.3 %)
0.17 이상 0.9 미만 = 2점 (531634명 →전체 매출의 25.7 %)
0.17 미만 = 1점 (554381명 →전체 매출의 4.9 %)


RFM 고객 분류 결과

RFM 세그먼트

R / F / M 각 점수를 합쳐 RFM 수치를 정성적인 평가 기준을 통해 고객 그룹 분류

1) 11가지 고객 등급

# 세그먼트 분류 
'445|454|455|544|545|554|555': 'VIP 고객'

'324|325|334|424|425|434|523|524|525|534|535': '잠재 VIP 고객'

'335|344|345|354|355|435|444': '충성 고객'

'421|422|521|522': '잠재 충성 고객'

'144|145|154|155|244|245|254|255': '이탈 VIP 고객'

'331|332|333|341|342|343|351|352|353|423|431|432|433|441|442|
443|451|452|453|531|532|533|541|542|543|551|552|553': '놓치면 안 될 고객'

'124|125|133|134|135|142|143|152|153|224|225|234|235|242|243|252|253': '이탈 우려 고객'

'411|412|413|414|415|511|512|513|514|515': '신규 고객'

'122|123|132|221|222|223|231|232|233|321|322|323': '동면 고객'

'111|112|113|114|115|121|131|141|151|211|212|213|214|215|311|312|313|314|315': '이탈 고객'

'241|251': '세일 러버'

2) 5가지 고객 분류 그룹

'VIP 고객' '충성 고객' : ’A’

'놓치면 안 될 고객' : 'B'

'잠재 VIP 고객' '잠재 충성 고객' : 'C'

'신규 고객' '이탈 우려 고객' '동면 고객' '세일 러버' : 'D'

'이탈 VIP 고객' '이탈 고객' : 'E'

군집화 결과 (GMM 클러스터링, 5개 군집)

군집화 대상 데이터 공통 사항

  • TRANSACTIONS 테이블 내 데이터가 있는
    (구매 기록이 있는 고객)
  • 최소 2개 이상의 날짜에 구매 기록이 있는
    (재구매 고객)
    • 즉, 재구매 고객을 대상으로 군집화 진행
  • 군집별 특성

  • 2, 3차원 시각화 (PCA Plot)

  • 실루엣 분포 (데이터 샘플링 ; 10 %)

  • t-SNE 분포 (데이터 샘플링 ; 10 %)

  • t-SNE 분포 (전체 데이터)


RFM 세그먼트 + GMM 클러스터 결합

  • RFM 세그먼트 & GMM 클러스터링 교차 분석

정리

고객 분류 결과

  • RFM 세그멘테이션 결과 = 11개의 세부 그룹과 5개의 고객 등급으로 분류
  • GMM 클러스터링 결과 = ( 5개의 군집 + 군집 분석 제외 그룹 ) 총 6개의 군집으로 분류
  1. 두 가지 고객 분류 방법을 통해 생성한 고객 분류 결과를 함께 활용하기에는 무리가 있을 것으로 판단,
    분류된 고객들의 구매 행동 분석 (코호트 리텐션 분석)을 통해 조금 더 데이터 설명이 가능한 분류 기준 선택하기

  2. 선택한 분류 기준의 KPI 지표 정리 → 해당 지표를 효과적으로 보여주고 판단 가능한 BI 대시보드 구축

  3. 이탈 고객 확률 예측 모델 구축 → 모델 성능 확인 → 이탈 고객이 될 확률이 높은 고객들에 대한 비즈니스 전략 수립


#최종 프로젝트 기획 재정리

프로젝트 주제 :
고객 데이터 분석을 통한 고객 세분화 및 이탈 예측

프로젝트 배경 :
고객을 유인하는 것보다, 유지하는 것이 더 힘들다.

프로젝트 목표 :
H&M 고객의 구매 패턴을 분석하여 고객을 세분화하고,
이탈 고객 예측 모델을 구축하여 이탈 위험 고객 관리를 통해 매출 향상에 기여.

프로젝트 핵심 내용 :

  • 분석 과정
  1. RFM 분석, 군집 분석 :
    고객 구매 특성, 빈도, 평균 금액 등을 분석하여 주요 고객 세그먼트 분류
  2. 세그먼트별 코호트 분석 :
    주요 고객에 대한 재구매율, 이탈율, 총 매출, 구매 횟수, 인기 제품 등 특징 분석
  3. 이탈 고객에 대한 예측 모델링 :
    의사결정 트리, 로지스틱 회귀, 랜덤 포레스트 모델 등 활용
  • 예상 결과물
  1. 이탈 예측 모델 :
    이탈 고객 예상 및 이탈율 예측, 이탈 위험군 관리, 이탈 고객 맞춤 전략 제시
  2. BI 현황 대시보드 :
    매출 현황, 고객 현황, 제품 현황 등 분석 결과 시각화

#OUTRO

오늘의 한 줄.

차근차근 하나씩.

profile
커피 좋아하는 데이터 꿈나무

0개의 댓글