고객을 특정 기준에 따라 군집화 하고, 군집별 인사이트를 도출하여 실시간 서비스반영에 대한 방향성을 제시하는 것
데이터셋에 대한 현황을 파악
다양한 condition(군집갯수, 컬럼갯수)을 통해 결과를 비교
군집(클러스터)별로 유의미한 특징을 살펴보고 이를 시각화
이를 바탕으로 군집별 인사이트를 제시
데이터 상세 정보
customers.csv (고객 거주지역 관련 정보, shape 99441 x 4)
order_items.csv (주문 상품 관련 정보, shape 112650 x 6)
orders.csv (주문 상태 관련 정보, shape 99441 x 7)
payments.csv (결제정보, shape 103886 x 5)
products.csv (상품 정보, shape 32951 x 6)
세부주제명
제안 사유
분석대상 칼럼
분석 방법
구매별이 아닌 고객별로 데이터를 변환(groupby customer_id)
고객별 결제타입, 요일, 시간대별 구매 횟수 계산
고객의 거주 지역은 최종 거주지역으로 산출
수치형자료는 고객별 평균으로 산출
데이터를 병합하여 군집분석 실시
군집 간 평균 차이의 유의성 검정 (ANOVA, Kruskal Wallis) 실시
예상 결과 및 시사점