[Pandas] 데이터 분석 기초 - 데이터 파악하기, 다루기 쉽게 수정하기 예제

FMA·2024년 12월 15일

Pandas

목록 보기
1/3

midwest.csv는 미국 동북중부(East North Central States) 437개 지역의 인구통계 정보를 담고 있다. midwest.csv를 이용해 데이터 분석 문제를 해결하시오.

문제1

midwest.csv를 불러와 데이터의 특징 파악하기

import pandas as pd
mw = pd.read_csv('./Doit_Python-main/Data/midwest.csv')

head(), tail(), shape, info(), describe()를 통해 대략적인 데이터의 특징을 파악한다.

mw.head() #앞에서부터 5행 출력

mw.tail() #뒤에서부터 5행 출력

mw.shape

(437, 28)

mw.info() #변수의 속성 파악

위 분석결과를 통해 다음과 같은 사실을 알 수 있다.

  1. midwest는 pandas로 만든 데이터 프레임이다.
  2. 437행으로 이루어져 있으며, 행번호는 0부터 436이다.
  3. 총 28열이며, 정수(int)와 실수(float), 문자(object)로 구성된다.
mw.describe() #요약 통계량 구하기

문제2

poptotal(전체 인구) 변수를 total로, popasian(아시아 인구) 변수를 asian으로 수정하기

mw_new = mw.copy() #복사본 만들기
mw_new.head()

0개의 댓글