TIL(24.08.08.)

codataffee·2024년 8월 8일

TIL

목록 보기
122/135
post-thumbnail

#INTRO

날씨 좋다 !


#코드카타

  • KATA #103

  • PANDAS

    • .str 메서드와 .len() 메서드 사용하기 :
      • .str 메서드 : 데이터 프레임의 문자열 데이터를 벡터화된(str) 방식으로
        처리할 수 있게 해주며, 문자열 함수들을 각 요소에 적용할 수 있다.
      • .len() 메서드 : 문자열의 길이를 계산하는 데 사용.
      tweets_15 = tweets[tweets['content'].str.len() > 15][['tweet_id']]
    • 두 개의 대괄호 [[ ]] 사용으로 컬럼을 데이터프레임 형태로 반환하기 :
    .... ) > 15][['tweet_id']]

#최종 프로젝트 진행


중간 발표 자료 제작

함께 고생한 팀원들에게 박수

NOTE

프로젝트 배경 & 목표 :
배경과 목표를 설명함에 있어 이탈 고객 방지가
비즈니스에 얼마나 중요한 것인지 설득하는 것에 집중하기

  1. H&M은 이미 멤버십 프로그램을 통해 고객을 유지하는 데 집중하고 있었음.

  2. 고객 유지의 중요성

    • 신규 고객 유치비용이 이탈 방지 비용보다 5 ~ 25 배 높음.
    • 신규 고객보다 기존 고객이 31% 더 많이 소비함.
    • 기존 고객이 신제품을 구매할 확률이 50% 더 높음.
  3. 기존 고객을 유지하는 고객 이탈방지가 H&M 의 성공 열쇠


데이터 분석 과정 :
데이터 확인, EDA 및 전처리 과정에서 어떠한 특성에 집중하여
다음 분석으로 넘어갈 수 있었는지 논리적 개연성에 집중하기

  1. 온/오프라인 매출 추이를 통해 팬데믹 시기 오프라인 매장을
    운영하지 않았던 현상이 담긴 실제 데이터라는 점 확인.

  2. 고객 데이터를 확인하여 20대 고객이 가장 높은 구매력을 보유하고, 1회성 고객이 전체 고객의 30% 가량 차지하고 있으며, 활성 회원의 비중이 높음을 확인.

  3. 제품 데이터의 컬럼 간 상관관계를 확인하여 중복되는 컬럼 제거

  4. 거래 데이터와 고객 데이터를 활용하여 고객 행동 분석의 가능성 확인


고객 세그멘테이션 :
고객을 분류하는 목적, 어떤 기준으로 고객을 나누고 그 고객들의 특성이 어떠한지를 잘 이해할 수 있도록 설명하는 것에 집중하기

  1. RFM 분석 과정 (분류 기준, 세그먼트별 특성 설명)

  2. 군집화 결과 (군집별 특성 설명)

  3. 각 군집별 리텐션 분석 결과를 통해 이탈 확률이 높은 고객군 이해


이탈 고객 예측 모델링 :
분류의 기준이 되는 이탈 고객에 대한 뾰족한 정의(논리성)와 모델 성능의 타당성에 대해 보여줄 수 있도록 집중하기

  1. 군집 & 세그먼트의 교차 그룹 고객의 낮고 회복되지 않는 리텐션 확인
  2. 이탈 고객에 대한 정의 및 이탈 고객 예측 모델링 과정 설명

BI 대시보드 :
앞선 분석의 결과를 종합하여 확인하고, 주요 기능인 이탈 고객 관리 대시보드의 효율과 중요성에 대해 설득할 수 있도록 집중하기

기본 KPI 대시보드, 고객 현황 대시보드, 이탈 고객 관리 대시보드 제작


결과 :
대시보드를 활용하여 어떻게 이탈 고객을 관리할 수 있는지,
이탈 고객 관리를 통해 얻을 수 있는 효과에 집중하여 정리하기

유지율 증가, 비용 절감, 매출 증대, 장기적 수익성 및 경쟁력 강화


#OUTRO

오늘의 한 줄.

중간 발표 잘 마무리하고 최종까지 끝까지 !

profile
커피 좋아하는 데이터 꿈나무

0개의 댓글