2025.04.23 본_캠프 45일차

민동·2025년 4월 23일
1

본캠프

목록 보기
44/74

1. Group A 재무건전성 (8개)

고객의 ‘재무 건전성’을 평가하는 변수 묶음

  • 변수 목록
    • per_capita_income (1인당 소득)
    • yearly_income (연간 소득)
    • total_debt (총 부채)
    • DTI (Debt-to-Income ratio: 부채÷소득)
    • credit_utilization (신용 한도 대비 사용률)
    • card_per_income (소득 대비 카드 수)
    • common_credit_score (100단위 신용점수 구간)
    • num_credit_cards (보유 신용카드 수)
  • 설명 & 기대 인사이트
    • 부채 수준 vs. 소득: DTI, total_debt, yearly_income으로 재무 위험도 구분
    • 한도 활용도: credit_utilization으로 과도 사용 고객 식별
    • 카드 과소비 리스크: card_per_income, num_credit_cards
    • 신용평점: common_credit_score로 신용등급별 분포 파악

2. Group B 소비패턴 (8개)

실제 소비 행태를 보여주는 변수 묶음

  • 변수 목록
    • amount (총 거래 금액 또는 평균 거래액)
    • trans_cnt (거래 건수)
    • trans_stats (거래 변동성: 표준편차÷평균)
    • high_amount_ratio (고액 결제 비율)
    • monthly_insufficient_rate (월단위 잔액부족 비율)
    • yearly_insufficient_rate (연단위 잔액부족 비율)
    • night_ratio (야간 거래 비율)
    • chip_use_ratio (칩 결제 비율)
  • 설명 & 기대 인사이트
    • 소비 규모 vs. 빈도: amount, trans_cnt
    • 안정성 vs. 충동: trans_stats가 높으면 변동성이 큰 충동 소비자
    • 리스크 행동: 잔액부족 비율(insufficient), 야간 거래 비율 등
    • 결제 수단 선호: chip_use_ratio로 안전결제 선호도

3. Group C 카드프로필 (7개)

고객의 카드 이용·관리 특성을 보여주는 변수 묶음

  • 변수 목록
    • ~~card_age (카드 보유 기간, 년 단위)~~
    • account_age (계좌 개설 후 경과 기간)
    • min_days_to_expire (만료일까지 남은 최소 일수)
    • pin_age (PIN 마지막 변경 후 경과 년수)
    • avg_cards_issued_per_year (연평균 발급 카드 수)
    • num_cards_issued (총 발급 카드 수)
    • credit_score (신용점수)
  • 설명 & 기대 인사이트
    • 신규 vs. 장기 고객: card_age, account_age
    • 보안 민감도: pin_age로 PIN 변경 주기 파악
    • 카드 관리 리스크: expires→min_days_to_expire
    • 발급 성향: avg_cards_issued_per_year, num_cards_issued

4. Group D 고객 정보 와 통계 (8개)

기본 인구·신용 통계를 합친 변수 묶음

  • 변수 목록
    • current_age (현재 나이)
    • retirement_age (예상 은퇴 나이)
    • per_capita_income (1인당 소득)
    • yearly_income (연소득)
    • num_credit_cards (보유 카드 수)
    • common_credit_score (100단위 신용 구간)
    • account_age (계좌 연령)
    • ~~card_age (카드 연령)~~
  • 설명 & 기대 인사이트
    • 연령대별 리스크: 은퇴가 임박한 고연령군 vs. 젊은층
    • 소득·신용: per_capita_income·yearly_income·credit_score
    • 카드 보유 경향: num_credit_cards + 연령 변수 결합

5. Group E 결합패턴 (7개)

재무·소비·보안 지표를 혼합한 변수 묶음

  • 변수 목록
    • amount
    • DTI
    • credit_utilization
    • high_amount_ratio
    • trans_stats
    • monthly_insufficient_rate
    • pin_age
  • 설명 & 기대 인사이트
    • 소비 규모 & 재무 건전성: amount + DTI
    • 과소비 vs. 변동성: credit_utilization + trans_stats
    • 현금부족 리스크: monthly_insufficient_rate
    • 보안 관리: pin_age 포함으로 보안 민감도와 소비 패턴 교차 분석

이렇게 5개 그룹으로 나누어 두면,

  • 각 그룹 단독 군집화 → 그룹별 특성 이해
  • 그룹 간 조합 군집화 → 변수 묶음 간 상호작용 파악
  • 범주형 변수 추가 실험 → 혼합 모델(K-Prototypes 등) 적용

cf) GroupA재무건전성+ GroupB소비패턴

  • 재무건전성 & 소비패턴 결합 클러스터링을 통한 고객 리스크 세분화
    • (고위험,고소비) 고객, (안정형,절약형)고객등 재무건전성 & 소비패턴 결합 클러스터링을 통한 고객 리스크 세분화
  • A
    • per_capita_income (1인당 소득)
    • yearly_income (연간 소득)
    • total_debt (총 부채)
    • DTI (Debt-to-Income ratio: 부채÷소득)
    • credit_utilization (신용 한도 대비 사용률)
    • card_per_income (소득 대비 카드 수)
    • common_credit_score (100단위 신용점수 구간)
    • num_credit_cards (보유 신용카드 수)
  • B
    • amount (총 거래 금액 또는 평균 거래액)

    • trans_cnt (거래 건수)

    • trans_stats (거래 변동성: 표준편차÷평균)

    • high_amount_ratio (고액 결제 비율)

    • monthly_insufficient_rate (월단위 잔액부족 비율)

    • yearly_insufficient_rate (연단위 잔액부족 비율)

    • night_ratio (야간 거래 비율)

    • chip_use_ratio (칩 결제 비율)

      이제 드디어 코딩 노가다 실험 최소 각자 50번의 실험을 진행하지 않을까..군집분석 어렵고 무섭다

profile
아자아자

2개의 댓글

comment-user-thumbnail
2025년 4월 27일

오.. 좀 열심히 한듯?

1개의 답글