삼성 전자 프로젝트(3)

라라·2025년 7월 24일
0

팀 프로젝트

목록 보기
7/7

#

내배캠 두 번째 팀 프로젝트

🗓️ 프로젝트 기간 🗓️

7월 9일부터 7월 21일까지


📖 오늘의 내가 한 일 📖

첫 주문 금액과 고객 생애 주기의 관계

가설 : 첫 주문 금액이 높은 고객일 수록 고객 생애 주기가 높다.


#구매 날짜 데이터 타입 확인 #오브젝트 타입 확인
SSE['Purchase Date'].dtype

[결과 값]

# 고객별 CLV 계산 (총 매출 합계)
CLV = SSE['Total Purchase Amount']
CLV

[결과 값]

#고객별 첫 주문 금액 추출
first_purchase = (SSE.sort_values('Purchase Date').groupby('Customer ID')['Total Purchase Amount'].first())
first_purchase

[결과 값]

from scipy.stats import pearsonr

#Pearson 상관계수 및 p-value 계산

r, p = pearsonr(cust['First Order Amount'], cust['CLV'])
print(f'📌 Pearson r = {r:.3f}, p-value = {p:.4f}')

[결과 값]

import matplotlib.pyplot as plt
import seaborn as sns

#시각화: seaborn.regplot 으로 산점도 + 회귀선

plt.figure(figsize=(7,5))
sns.regplot(
    data=cust,
    x='First Order Amount',
    y='CLV',
    line_kws={'color':'red', 'linewidth':2},
    scatter_kws={'alpha':0.4}
)
plt.title(f'first purchase amount vs CLV  (r={r:.3f}, p={p:.4f})')
plt.xlabel('first purchase amount')
plt.ylabel('CLV')
plt.tight_layout()
plt.show()

[결과 값]


결론:

  • 첫 구매 금액이 높을 수록 CLV가 높은 것으로 나타났다.(귀무가설 기각)
  • 하지만 CLV가 총 구매 금액이라서 고객 별 구매 금액, 상품 단가, 구매량 등에 영향을 강하게 받는건 아닐까?
profile
공부를 위해 기록하는 공간

0개의 댓글