[2차] 데이터분석 프로젝트 day2

고근호·2023년 9월 7일

도메인 설명

공공임대아파트 주차 등록 수요

법정 주차 대수 ≠ 실제 주차 대수

  • 세대당 전용면적이 60m² 이하일 경우 75m² 당 1대.
  • 초과시 60m² 당 1대의 주차공간이 마련되어야 함.
  • 영구임대주택은 0.4대.
  • 국민임대주택은 전용면적에 따라 0.8~1대.
  • 행복주택은 대상 구분에 따라 0.3~1대.

법정주차대수 << 실제주차대수

  • -자녀가 모두 미성년자인 세대?
  • +자녀가 있으나 취업 이후에도 함께 생활?
  • -근처 대중교통이 활성화되어 있어 이동시 차량 필요가 적다면?
  • +인근 지하철 및 버스 이용이 어려운 지역?
  • -차량 구매가 어려운 경제적 상황?

기존 공공임대주택 정보를 활용하여 주차 등록 수요를 분석한다.

Mission2. 데이터 전처리

  • 범주형, 숫자형에 대한 전처리
  • 단지별 데이터와 상세 데이터를 분리

Mission3. 데이터 분석

  • 단변량 분석 : 히스토그램, KDE plot 등
  • 이변량 분석 : 상관분석, 산점도, heatmap 등
  • 비즈니스 인사이트 도출

미션#2 주차 등록 수요 데이터 전처리

  • 단지별 데이터와 상세 데이터를 분리
  • 범주형, 숫자형에 대한 전처리
  • 데이터분석을 위한 형태로 재결합

데이터 셋

  • 데이터셋에서는 [단지별 공통 정보] 와 [당지 상세정보] 가 함께 저장되어 있음.
  • 등록차량수를 Target 으로 분석

데이터 전처리 순서

① [단지별 공통 정보] 와 [단지 상세 정보] 를 분리 및 중복 제거
② [단지별 공통 정보] 와 중복 행 제거
③ 범주형 변수의 category 수 줄이기, 숫자형 변수 확인하기
④ [단지 상세 정보] 집계를 통해 단지별 정보 구하기

  • 전용 면적 구간별 세대수, 임대보증금/임대료(평균/중앙값)
  • [도전미션] 임대보증금/임대료(가중평균), 임대건물구분/공급 유형별 총 면적

⑤ [단지별 공통 정보] 에 [단지 상세 정보] 집계 내용을 합치기

범주형 변수의 category 수 줄이기

  • 줄이고자 하는 category(change_list) 가 포함된 열을 찾아, 원하는 category 로 변경

수치형 변수의 데이터 타입 변환하기

  • 수치형 변수이나 object 형으로 인식된 열을 찾아, 원인을 제거하고 float 타입으로 변환

집계를 통해 단지별 정보 구하기

  • 단지별 전용면적과 세대수 데이터를 활용하여, 단지별 & 전용면적구간별 세대수를 집계

집계를 통해 단지별 정보 구하기

  • 단지내 전용면적별 임대보증금/임대료를 활용하여, 단지별 평균 임대보증금/임대료를 집계

도전 미션

  • 세대수를 적용한 총 면적 기준으로, 임대건물구분 비율 집계를 통해 단지별 정보 구하기

  • 세대수를 적용한 총 면적 기준으로, 공급유형 비율 집계를 통해 단지별 정보 구하기

에상 산출물

활용 라이브러리 및 함수

profile
rootgo 매일, 꾸준히 성장하는 사람🌱

0개의 댓글