[제로베이스 데이터 취업 스쿨 16기] 인구 소멸 위기 지역 분석

장수호·2023년 7월 17일
0

프로젝트 개요

목표

  1. 인구 소멸 위기 지역 파악
  • 소멸위험지수 : 65세 고령 인구 대비 20-39세 여성 인구 비중. 0.5 이하면 30년 내 소멸 가능성 크다고 판단. 본 프로젝트에서 인구 소멸 위기 지역의 기준치
  1. 인구 소멸 위기 지역의 지도 표현
  • folium용 json 파일, 인구현황 파일 필요
  1. 지도 표현에 대한 카르토그램 표현

인구 현황 데이터 정리 및 인구 소멸 위기 지역 계산

칼럼 이름 정리, 불필요한 행 제거

65세 이상 고령 인구 및 20-39세 인구 정리

시도별 고령 인구 및 20-39세 인구 정리

인구 소멸 위기 지역 계산

지도 ID 만들기

ID 부여 기준

  • 행정구가 없는 경우 시 이름으로 함.
  • 자치구나 행정구가 있는 경우 시 이름 + 구 이름으로 함. 이때 구 이름이 2글자 이상이면 맨 뒤 구 글자를 생략하고 한글자이면 구 글자 함께 기입.
    EX) 서울 영등포구 -> 서울 영등포, 서울 중구 -> 서울 중구

일반시, 자치구 정리

  • 고성군의 경우 강원도와 경상남도에 각각 있기 때문에 따로 전처리

행정구 정리

  • 데이터에서 행정구의 시에 대한 정보가 없어서 따로 정리

카르토그램 그리기

지도 파일 정리

  • 엑셀 파일에 지도 형태로 각 지역의 이름 저장

  • pivot_table로 각 지역을 좌표 인덱스로 구분

  • 경계선 좌표 지정

지도 함수 작성

  • 각 지역 좌표에 텍스트를 기입하고, plot 함수로 경계선 좌표를 이어서 지역 구분선 그림

데이터 계산

  • targetData : 그리고 싶은 칼럼
  • blockedMap : 인구현황 데이터
  • whitelabelmin : 색상이 진할 때 흰색, 연할 때 검은 색 텍스트를 쓰기 위한 기준값

  • zeroCenter가 False가 되면 가장 낮은 값이 흰색이 되고, True가 되면 0이 흰색이 되어 양수와 음수의 대비되는 시각화를 기대할 수 있음
  • plt.pcolor : 해당하는 좌표에 값만큼 색을 칠함
  • plt.gca().invert_yaxis() : 위아래를 뒤집음

결과




※ 학습 자료에 대한 저작권은 제로베이스에 있습니다.

0개의 댓글