고객의 ‘재무 건전성’을 평가하는 변수 묶음
per_capita_income
(1인당 소득)yearly_income
(연간 소득)total_debt
(총 부채)DTI
(Debt-to-Income ratio: 부채÷소득)credit_utilization
(신용 한도 대비 사용률)card_per_income
(소득 대비 카드 수)common_credit_score
(100단위 신용점수 구간)num_credit_cards
(보유 신용카드 수)실제 소비 행태를 보여주는 변수 묶음
amount
(총 거래 금액 또는 평균 거래액)trans_cnt
(거래 건수)trans_stats
(거래 변동성: 표준편차÷평균)high_amount_ratio
(고액 결제 비율)monthly_insufficient_rate
(월단위 잔액부족 비율)yearly_insufficient_rate
(연단위 잔액부족 비율)night_ratio
(야간 거래 비율)chip_use_ratio
(칩 결제 비율)고객의 카드 이용·관리 특성을 보여주는 변수 묶음
~~card_age
(카드 보유 기간, 년 단위)~~account_age
(계좌 개설 후 경과 기간)min_days_to_expire
(만료일까지 남은 최소 일수)pin_age
(PIN 마지막 변경 후 경과 년수)avg_cards_issued_per_year
(연평균 발급 카드 수)num_cards_issued
(총 발급 카드 수)credit_score
(신용점수)기본 인구·신용 통계를 합친 변수 묶음
current_age
(현재 나이)retirement_age
(예상 은퇴 나이)per_capita_income
(1인당 소득)yearly_income
(연소득)num_credit_cards
(보유 카드 수)common_credit_score
(100단위 신용 구간)account_age
(계좌 연령)~~card_age
(카드 연령)~~재무·소비·보안 지표를 혼합한 변수 묶음
amount
DTI
credit_utilization
high_amount_ratio
trans_stats
monthly_insufficient_rate
pin_age
이렇게 5개 그룹으로 나누어 두면,
cf) GroupA재무건전성+ GroupB소비패턴
per_capita_income
(1인당 소득)yearly_income
(연간 소득)total_debt
(총 부채)DTI
(Debt-to-Income ratio: 부채÷소득)credit_utilization
(신용 한도 대비 사용률)card_per_income
(소득 대비 카드 수)common_credit_score
(100단위 신용점수 구간)num_credit_cards
(보유 신용카드 수)amount
(총 거래 금액 또는 평균 거래액)
trans_cnt
(거래 건수)
trans_stats
(거래 변동성: 표준편차÷평균)
high_amount_ratio
(고액 결제 비율)
monthly_insufficient_rate
(월단위 잔액부족 비율)
yearly_insufficient_rate
(연단위 잔액부족 비율)
night_ratio
(야간 거래 비율)
chip_use_ratio
(칩 결제 비율)
이제 드디어 코딩 노가다 실험 최소 각자 50번의 실험을 진행하지 않을까..군집분석 어렵고 무섭다
오.. 좀 열심히 한듯?