24.02.14 TIL

예진·2024년 2월 14일
0

TIL

목록 보기
36/68

모델 성능평가 끝내고 SQL로 EDA 뽑아보는 중.
데이터 사이즈가 너무 커서 10만개 중 2만개밖에 안보인다..
쿼리를 짜는 건 쉬운데 1/5밖에 안되는 거니까 결국 파이썬 써야할듯,,,,


  • 대출금액 대비 상환율 계산:
    대출금액대비원금상환율 = (총상환원금 / 대출금액) 100
    대출금액대비이자상환율 = (총상환이자 / 대출금액)
    100
  • 소득 대비 상환율 계산:
    소득대비상환율 = ((총상환원금 + 총상환이자) / 연간소득) 100
    대출금액 대비 연간 소득 비율 계산:
    대출금액대비연간소득비율 = (대출금액 / 연간소득)
    100
  • 연체 계좌 비율 계산:
    연체계좌비율 = (최근 2년간 연체 횟수 / 총계좌수) * 100
  • 부채 대비 소득 비율 분석:
    대출금액대비소득비율 = 부채 대비 소득 비율 * 100
  • 주택 소유 여부에 따른 대출 금액 분석:
    주택 소유자와 비소유자의 대출금액 통계 비교
  • 대출 목적에 따른 대출 금액 분석:
    대출목적 별 대출금액의 평균, 중앙값, 최소값, 최대값 분석
  • 대출 등급에 따른 대출 조건 분석:
    대출등급 별 대출금액, 대출기간, 연체 횟수, 상환원금, 상환이자 등의 통계 분석
  • 추가 통계 분석:
    총상환원금이 0인 데이터, 근로기간이 Unknow인 데이터 통계 분석 추가로 진행

굳이 SQL로 하려고 했던 건 원하는 정보만 뽑기에 용이하고 수치 확인이 간편해서였는데,
데이터가 모자란 건 너무 치명적이다.
쫌,, 당황스럽지만,, 길은 찾았으니 일단 요대로 진행 해보는걸로..

그나마 다행인 건 얼추 흐름이 보여서 프로젝트 후반 작업은 수월할 예정!

profile
Data Analysis / 맨 땅에 헤딩

0개의 댓글