기초프로젝트- 은행 고객 데이터를 이용한 서비스 분석

김요한·2024년 8월 1일
post-thumbnail










BankData테이블의 컬럼

columndescription
ID고객번호에 대한 월별 고유ID(유니크값)
Customer_ID고객번호
Month
Name이름
Age나이
SSN사회보장번호(한국의 주민등록번호)
Occupation직업
Annual_Income연간 소득
Monthly_Inhand_Salary월급
Num_Bank_Accounts보유 계좌 갯수
Num_Credit_Card보유 카드 갯수
Interest_Rate이자율
Num_of_Loan대출 건수
Type_of_Loan대출 종류
Delay_from_due_date마감 지연일
Num_of_Delayed_Payment마감 지연 건수
Changed_Credit_Limit카드 사용한도 변경 횟수
Num_Credit_Inquiries신용조회건수
Credit_Mix신용도
Outstanding_Debt미지불 채무
Credit_Utilization_Ratio신용 활용율
Credit_History_Age신용 기간
Payment_of_Min_Amount최소 결제금액
Total_EMI_per_month월 할부금 총액
Amount_invested_monthly월 투자금 총액
Payment_Behaviour결제(투자) 성향
Monthly_Balance월간 잔액

배경


☑️ ‘어쩌구저쩌구’ 은행회사에 다니는 데이터분석가 ‘아무개’는 새로운 프로젝트를 맡게 되었어요.

☑️ 프로젝트 요청사항은 아래와 같아요.

  • 고객의 금융데이터를 탐색하여, 타 부서에게 서비스 현황을 볼 수 있게 해주세요.
  • 우리의 서비스가 앞으로 어떠한 방향으로 나아갈 지 확인할 수 있었으면 좋겠어요.

주제


☑️ “은행 고객데이터에 대한 EDA 진행, 서비스 현황 확인 및 개선점 제시” 로 생각해주세요.

☑️ 주어진 데이터를 활용하여 EDA 를 진행하여 아래 항목에 대한 확인이 가능하면 더더욱 좋겠죠?

  • 서비스의 현 상태 확인
  • 이슈사항 확인
  • 고객 세그먼트화(특정 기준에 따라 유저를 나눔)
  • 인사이트 제공
  • 📑 고위험군 고객을 위한 맞춤 자산 관리 추천 서비스
    • 주제 : 은행 고객데이터를 이용한 서비스 분석
    • 요약 :자산관리에 어려움을 보이는 고위험군 고객 세그먼트에 대해 고객 특징별 맞춤
      상품/서비스 추천 시스템 제안
    • 프로젝트 목표:
      자산관리에 어려움을 보이는 고위험군 고객 세그먼트에 대해, 고객 특징별 안전성을 띄는 상품 추천 서비스 제안
  • 이 번 프로젝트는 팀프로젝트이지만 기초프로젝트임을 감안하여 개인의 역량을 높이기 위해
    개인 목표 설정정도만 공유하고 각자 개인으로 ppt완성까지 모두 진행하였다.
  • 프로젝트를 하면서 아쉬웠던 점
    • 조원이 같이 데이터를 전처리 과정을 하며 데이터를 분해해보고 연관관계를 도출하여
      고위험군 세그먼트 기준을 정립했으면 했다.
      왜냐하면 각자 세그먼트 기준과 목적성이 달라져 마지막에 각자의 유의미한 도출을 취합하기 어려웠다.
  • 프로젝트를 하면서 좋았던 점
    • 전처리 과정의 어려움이나 이상치 처리 방법 그리고 서로의 의견을 존중하고 공유를
      스크럼회의 시간이나 슬랙에서 활발하게 진행하여서 좋았다.
  • 나의 프로젝트 미흡한 점
      1. 전처리 과정 정리 미흡 : 전처리 과정에 대부분의 시간을 투자해야했던 금융데이터였던 만큼 전처리를 진행하면서 어떤 전처리를 진행하였고 어떻게 진행하였는지 정리를 할 필요성이 있었다. 코드가 계속해서 늘어가면서 내가 어떤 전처리를 진행했고 어떻게 진행했는지 헷갈렸다.
      1. 고위험군 세그먼트 정립 미흡 및 목적 상실 : 처음엔 나름대로 신용도를 bad로 하고 신용활용도30%이상 등 기준을 잡고 진행하려했으나 주관적인 개입이 들어가 모두 이상치로 판별이 났다. 그래서 목적과는 다르게 전체데이터로 연관성을 도출해 완성시켰다.
      1. 결론 분석 설명 부실 : 마지막 막대그래프를 이용한 결론 도출은 많이 부실하였다. 대출 건수 9회 이상 고객들 중 월급 대비 지출이 적은 그래프도 있어 시각화에 신뢰성이 없었다. 다른 결론을 도출하거나 여기서 더 나아가 9회이상 고객 평균 월급 대비 지출금액에 대한 분석이 추가로 필요했다.
      1. 데이터 활용성 부재 : 여러 컬럼들과의 연관성을 시각화나 유의성 검증을 통해 확인하고 여러 원인 및 분석이 많이 부족하다고 느꼈다.
  • 프로젝트를 마치며 느낀점
    프로젝트를 진행하면서 목적과 세그먼트를 잘 세우는것에 대한 중요성을 느꼈다.
    목적의 방향성에 맞게 세그먼트를 컬럼관의 연관성에 유의하여 신뢰있는 세그먼트를 세우고
    전처리나 프로젝트 진행 상황에 대해 더욱 꼼꼼히 기록하며 진행해야 할 필요성이 있었다.
    전처리나 시각화만 배운 상태라 많이 부족하지만
    다음을 위한 기초 초석을 다졌다 생각한다.

0개의 댓글