- 추가적으로 재구매율이 궁금하여 배송기간별, 상품무게별로 재구매율을 구해봄
- 마지막으로 요약
# 1. 고객별 첫 구매 당시의 배송 기간과 재구매 여부 정리
# 고객별 주문 횟수 계산
customer_order_counts = df.groupby('customer_unique_id')['order_id'].nunique()
reordered_customers = customer_order_counts[customer_order_counts > 1].index
# 첫 번째 주문의 배송 기간 추출 (데이터가 정렬되어 있다고 가정)
first_orders = df.sort_values('order_purchase_timestamp').groupby('customer_unique_id').first()
# 2. 배송 기간 구간 나누기 (0~3일, 4~7일, 8~14일, 14일 초과)
bins = [0, 3, 7, 14, 100]
labels = ['매우 빠름(3일내)', '보통(7일내)', '느림(14일내)', '매우 느림(14일초)']
first_orders['delivery_range'] = pd.cut(first_orders['actual_duration'], bins=bins, labels=labels)
# 3. 구간별 재구매율 계산
first_orders['is_reordered'] = first_orders.index.isin(reordered_customers)
retention_by_delivery = first_orders.groupby('delivery_range')['is_reordered'].mean() * 100
print("--- [배송 기간별 재구매율 (%)] ---")
print(retention_by_delivery)

재구매율이 전체적으로 높지는 않았지만 3일내 배송보다 7일내 배송이 더 재구매율이 높았다
# 1. 고객별 첫 구매 당시의 상품 무게와 재구매 여부 정리
# (고객별 주문 횟수 및 재구매 고객 리스트는 기존 코드 사용)
customer_order_counts = df.groupby('customer_unique_id')['order_id'].nunique()
reordered_customers = customer_order_counts[customer_order_counts > 1].index
# 첫 번째 주문 데이터 추출 (무게 정보 포함)
first_orders = df.sort_values('order_purchase_timestamp').groupby('customer_unique_id').first()
# 2. 무게 구간 나누기 (g 단위)
# 500g 미만(초소형), 2kg 미만(소형), 10kg 미만(중형), 10kg 초과(대형)
weight_bins = [0, 500, 2000, 10000, 100000]
weight_labels = ['초소형(500g내)', '소형(2kg내)', '중형(10kg내)', '대형(10kg초)']
first_orders['weight_range'] = pd.cut(first_orders['product_weight_g'], bins=weight_bins, labels=weight_labels)
# 3. 구간별 재구매율 계산
first_orders['is_reordered'] = first_orders.index.isin(reordered_customers)
retention_by_weight = first_orders.groupby('weight_range')['is_reordered'].mean() * 100
print("--- [상품 무게별 재구매율 (%)] ---")
print(retention_by_weight)

재구매율이 전체적으로 높지는 않았지만 2kg초과보다 2kg이내가 더 재구매율이 높았다
평균 배송기간 상위 5개 카테고리
1위 사무용 가구 : 부피와 무게
평균 준비기간 상위 5개 카테고리
1위 사무용 가구
평균 운송기간 상위 5개 카테고리
1위 보안 및 서비스
평균 가격 상위 5개 카테고리
1위 컴퓨터
평균 운송비 상위 5개 카테고리
1위 컴퓨터
평균 무게 상위 5개 카테고리
1위 사무용 가구
전략적 방향 : 배송은 7일 이내로, 효율은 2kg 물품으로
전략 A : 배송 프로세스 혁신
전략 B : 상품군별 물류 이원화
전략 C : 데이터 기반 마케팅과 보상