Python for Data Analysis

주제무·2022년 5월 28일
0

O'Reilly Python for Data Analysis

Ch7 데이터 정제 및 준비

from pandas import DataFrame as df

누락된 데이터; NaN


NaN 골라내기

df.isnull()
df.dropna()

NaN 채우기

df.fillna(value=, method=) # value can be dict or scala

데이터 수정


중복 제거

df.duplicated() -> dataframe dtype boolean
df.drop_duplicates(subset=, keep=)

값을 기준으로 컬럼 추가하기


0개의 댓글