
날씨 좋다 !
PANDAS
.str 메서드와 .len() 메서드 사용하기 :.str 메서드 : 데이터 프레임의 문자열 데이터를 벡터화된(str) 방식으로.len() 메서드 : 문자열의 길이를 계산하는 데 사용. tweets_15 = tweets[tweets['content'].str.len() > 15][['tweet_id']]
[[ ]] 사용으로 컬럼을 데이터프레임 형태로 반환하기 :.... ) > 15][['tweet_id']]

함께 고생한 팀원들에게 박수
NOTE
프로젝트 배경 & 목표 :
배경과 목표를 설명함에 있어 이탈 고객 방지가
비즈니스에 얼마나 중요한 것인지 설득하는 것에 집중하기
→
H&M은 이미 멤버십 프로그램을 통해 고객을 유지하는 데 집중하고 있었음.
고객 유지의 중요성
기존 고객을 유지하는 고객 이탈방지가 H&M 의 성공 열쇠
데이터 분석 과정 :
데이터 확인, EDA 및 전처리 과정에서 어떠한 특성에 집중하여
다음 분석으로 넘어갈 수 있었는지 논리적 개연성에 집중하기
→
온/오프라인 매출 추이를 통해 팬데믹 시기 오프라인 매장을
운영하지 않았던 현상이 담긴 실제 데이터라는 점 확인.
고객 데이터를 확인하여 20대 고객이 가장 높은 구매력을 보유하고, 1회성 고객이 전체 고객의 30% 가량 차지하고 있으며, 활성 회원의 비중이 높음을 확인.
제품 데이터의 컬럼 간 상관관계를 확인하여 중복되는 컬럼 제거
거래 데이터와 고객 데이터를 활용하여 고객 행동 분석의 가능성 확인
고객 세그멘테이션 :
고객을 분류하는 목적, 어떤 기준으로 고객을 나누고 그 고객들의 특성이 어떠한지를 잘 이해할 수 있도록 설명하는 것에 집중하기
→
RFM 분석 과정 (분류 기준, 세그먼트별 특성 설명)
군집화 결과 (군집별 특성 설명)
각 군집별 리텐션 분석 결과를 통해 이탈 확률이 높은 고객군 이해
이탈 고객 예측 모델링 :
분류의 기준이 되는 이탈 고객에 대한 뾰족한 정의(논리성)와 모델 성능의 타당성에 대해 보여줄 수 있도록 집중하기
→
BI 대시보드 :
앞선 분석의 결과를 종합하여 확인하고, 주요 기능인 이탈 고객 관리 대시보드의 효율과 중요성에 대해 설득할 수 있도록 집중하기
→
기본 KPI 대시보드, 고객 현황 대시보드, 이탈 고객 관리 대시보드 제작
결과 :
대시보드를 활용하여 어떻게 이탈 고객을 관리할 수 있는지,
이탈 고객 관리를 통해 얻을 수 있는 효과에 집중하여 정리하기
→
유지율 증가, 비용 절감, 매출 증대, 장기적 수익성 및 경쟁력 강화
오늘의 한 줄.
중간 발표 잘 마무리하고 최종까지 끝까지 !