
10년 전과 지금의 인구 현황을 비교해보려고 한다.
이제는 실제로 존재하는 데이터를 활용해보자
① 구글에 '연령별 인구현황' 검색 → 여기에 들어가서 원하는 조건 설정 후 파일 다운로드


② 작업하는 폴더에 파일을 넣고 확인
→ 맨 위의 3행은 필요 없겠군. + 도시별로 나누지는 말고 전국 기준으로만 해봐야겠어.


③ 판다스의 .read_excel로 파일을 불러와 작업 수행 (아래에 계속)
usecols : 원하는 column만 선택해서 불러올 수 있음.skiprows와 index_col은 <Pandas>에서 배웠던 내용!)

.str.replace() 와 .astype(int)로 사용할 값을 콤마 없는 정수값으로 수정함. (.str.replace(), .iloc 역시 배웠던 내용!)

usecols의 범위만 다르게 지정하고, 동일한 방식으로 불러옴.
df_w.columns를 확인해보면, 중복을 피하기 위해 ".1"이 다 붙어있음.

plt.barh()로 남자 데이터 먼저 그려봄)


plt.savefig 써서 사진 파일로도 저장함)
피라미드 형태로 그래프를 그렸더니, 남녀 인구수가 연령별로 어떻게 차이나는지 파악하기 좋은 자료가 만들어졌군. 이제 같은 방식으로 2022년도 그려보자!



생각보다 간단한 내용인 것 같다. 그냥 데이터 시각화만 해본 느낌? '분석'이라고 하려면 더 심도있는 과정이 필요할 듯.