[python] pandas dataframe관련 함수(parse_dates, resample, drop_duplicate, select_dtypes)

김민석·2022년 6월 26일

빅데이터분석기사 실기 준비를 하며 새롭게 배운 기능에 대한 정리 입니다. (언어 - Python)

pandas.read_csv

df = pd.read_csv('path/basic2.csv', parse_dates = ['Date'], index_col = ['Date'])

pandas.resample()

datetime 인덱스를 원하는 주기로 나누어줍니다.
df.resample(rule, axis=0, closed=None, label=None, convention='start', kind=None, loffset=None, base=None, on=None, level=None, origin='start_day', offset=None)
rule 은 원하는 주기 ('W' : 1 주 단위, '2W' : 2주 단위, 'M' : 달 단위 ..)

pandas.drop_duplicates(subset = [''])

DataFrame.select_dtypes(include=None, exclude=None)

데이터 사이언스를 공부하는 커피쟁이