▶ 데이터 전처리 & 시각화 4주차
▶ 데이터 시각화 실습
1. Pandas의 자료 구조
2. rename
inplace를 True로 지정할 경우 원본 데이터의 컬럼명을 바로 변경할 수 있음# df의 'org_name' 컬럼명 교체
df.rename(columns = {'org_name': 'new_name'}, inplace = True)
3. DataFrame.keys()
keys 메서드는 info axis(정보축) 값을 가져옴df.keys()
4. 데이터 확인
shape df.shape
# 출력 : (행 개수, 열 개수)
dtypesdf.dtype
columnsdf.columns
isnull / isna5. 데이터 병합
concataxis=1 : 열 방향 - 좌, 우로 합치기axis=0 : 행 방향 - 위, 아래로 합치기ignore_index : 기존 인덱스를 무시할 것인지 여부pd.concat([df1, df2, df2, axis = 0, ignore_index = True])
mergeJOIN과 유사함how: 데이터를 어떻게 합칠 것인지left, right, outer, inner, crossinneron: 데이터를 합칠 때 기준으로 잡을 컬럼pd.merge(df1, df2, how = "inner", on = "column_name")
6. 데이터 저장
to_csv : csv 파일로 저장# 한글깨짐 현상 방지: encoding = "UTF-8-SIG"
df.to_csv("filename", encoding = "UTF-8-SIG", index = True)
to_excel : excel 파일로 저장df.to_excel("filename", index = True)