#
7월 9일부터 7월 21일까지
첫 주문 금액과 고객 생애 주기의 관계
가설 : 첫 주문 금액이 높은 고객일 수록 고객 생애 주기가 높다.
#구매 날짜 데이터 타입 확인 #오브젝트 타입 확인
SSE['Purchase Date'].dtype
[결과 값]

# 고객별 CLV 계산 (총 매출 합계)
CLV = SSE['Total Purchase Amount']
CLV
[결과 값]

#고객별 첫 주문 금액 추출
first_purchase = (SSE.sort_values('Purchase Date').groupby('Customer ID')['Total Purchase Amount'].first())
first_purchase
[결과 값]

from scipy.stats import pearsonr
#Pearson 상관계수 및 p-value 계산
r, p = pearsonr(cust['First Order Amount'], cust['CLV'])
print(f'📌 Pearson r = {r:.3f}, p-value = {p:.4f}')
[결과 값]

import matplotlib.pyplot as plt
import seaborn as sns
#시각화: seaborn.regplot 으로 산점도 + 회귀선
plt.figure(figsize=(7,5))
sns.regplot(
data=cust,
x='First Order Amount',
y='CLV',
line_kws={'color':'red', 'linewidth':2},
scatter_kws={'alpha':0.4}
)
plt.title(f'first purchase amount vs CLV (r={r:.3f}, p={p:.4f})')
plt.xlabel('first purchase amount')
plt.ylabel('CLV')
plt.tight_layout()
plt.show()
[결과 값]

결론: