










BankData테이블의 컬럼
| column | description |
|---|---|
| ID | 고객번호에 대한 월별 고유ID(유니크값) |
| Customer_ID | 고객번호 |
| Month | 월 |
| Name | 이름 |
| Age | 나이 |
| SSN | 사회보장번호(한국의 주민등록번호) |
| Occupation | 직업 |
| Annual_Income | 연간 소득 |
| Monthly_Inhand_Salary | 월급 |
| Num_Bank_Accounts | 보유 계좌 갯수 |
| Num_Credit_Card | 보유 카드 갯수 |
| Interest_Rate | 이자율 |
| Num_of_Loan | 대출 건수 |
| Type_of_Loan | 대출 종류 |
| Delay_from_due_date | 마감 지연일 |
| Num_of_Delayed_Payment | 마감 지연 건수 |
| Changed_Credit_Limit | 카드 사용한도 변경 횟수 |
| Num_Credit_Inquiries | 신용조회건수 |
| Credit_Mix | 신용도 |
| Outstanding_Debt | 미지불 채무 |
| Credit_Utilization_Ratio | 신용 활용율 |
| Credit_History_Age | 신용 기간 |
| Payment_of_Min_Amount | 최소 결제금액 |
| Total_EMI_per_month | 월 할부금 총액 |
| Amount_invested_monthly | 월 투자금 총액 |
| Payment_Behaviour | 결제(투자) 성향 |
| Monthly_Balance | 월간 잔액 |
☑️ ‘어쩌구저쩌구’ 은행회사에 다니는 데이터분석가 ‘아무개’는 새로운 프로젝트를 맡게 되었어요.
☑️ 프로젝트 요청사항은 아래와 같아요.
☑️ “은행 고객데이터에 대한 EDA 진행, 서비스 현황 확인 및 개선점 제시” 로 생각해주세요.
☑️ 주어진 데이터를 활용하여 EDA 를 진행하여 아래 항목에 대한 확인이 가능하면 더더욱 좋겠죠?
- 📑 고위험군 고객을 위한 맞춤 자산 관리 추천 서비스
주제: 은행 고객데이터를 이용한 서비스 분석요약:자산관리에 어려움을 보이는 고위험군 고객 세그먼트에 대해 고객 특징별 맞춤
상품/서비스 추천 시스템 제안프로젝트 목표:
자산관리에 어려움을 보이는 고위험군 고객 세그먼트에 대해, 고객 특징별 안전성을 띄는 상품 추천 서비스 제안
- 이 번 프로젝트는 팀프로젝트이지만 기초프로젝트임을 감안하여 개인의 역량을 높이기 위해
개인 목표 설정정도만 공유하고 각자 개인으로 ppt완성까지 모두 진행하였다.
- 프로젝트를 하면서 아쉬웠던 점
- 조원이 같이 데이터를 전처리 과정을 하며 데이터를 분해해보고 연관관계를 도출하여
고위험군 세그먼트 기준을 정립했으면 했다.
왜냐하면 각자 세그먼트 기준과 목적성이 달라져 마지막에 각자의 유의미한 도출을 취합하기 어려웠다.
- 프로젝트를 하면서 좋았던 점
- 전처리 과정의 어려움이나 이상치 처리 방법 그리고 서로의 의견을 존중하고 공유를
스크럼회의 시간이나 슬랙에서 활발하게 진행하여서 좋았다.
- 나의 프로젝트 미흡한 점
- 전처리 과정 정리 미흡 : 전처리 과정에 대부분의 시간을 투자해야했던 금융데이터였던 만큼 전처리를 진행하면서 어떤 전처리를 진행하였고 어떻게 진행하였는지 정리를 할 필요성이 있었다. 코드가 계속해서 늘어가면서 내가 어떤 전처리를 진행했고 어떻게 진행했는지 헷갈렸다.
- 고위험군 세그먼트 정립 미흡 및 목적 상실 : 처음엔 나름대로 신용도를
bad로 하고신용활용도를30%이상 등 기준을 잡고 진행하려했으나 주관적인 개입이 들어가 모두 이상치로 판별이 났다. 그래서 목적과는 다르게 전체데이터로 연관성을 도출해 완성시켰다.
- 결론 분석 설명 부실 : 마지막 막대그래프를 이용한 결론 도출은 많이 부실하였다. 대출 건수 9회 이상 고객들 중 월급 대비 지출이 적은 그래프도 있어 시각화에 신뢰성이 없었다. 다른 결론을 도출하거나 여기서 더 나아가 9회이상 고객 평균 월급 대비 지출금액에 대한 분석이 추가로 필요했다.
- 데이터 활용성 부재 : 여러 컬럼들과의 연관성을 시각화나 유의성 검증을 통해 확인하고 여러 원인 및 분석이 많이 부족하다고 느꼈다.