[pandas] Read and Write

kkiyou·2021년 6월 20일
0

Data Science

목록 보기
9/11

참고자료

Input/output




1. read_csv

pandas.read_csv(filepath_or_buffer, 
                sep=<object object>,
                delimiter=None,
                header='infer', 
                names=None, 
                index_col=None, 
                usecols=None, 
                squeeze=False, 
                prefix=None, 
                mangle_dupe_cols=True,
                dtype=None, 
                engine=None, 
                converters=None, 
                true_values=None, 
                false_values=None, 
                skipinitialspace=False, 
                skiprows=None, 
                skipfooter=0, 
                nrows=None, 
                na_values=None, 
                keep_default_na=True, 
                na_filter=True, 
                verbose=False, 
                skip_blank_lines=True, 
                parse_dates=False, 
                infer_datetime_format=False, 
                keep_date_col=False, 
                date_parser=None, 
                dayfirst=False, 
                cache_dates=True, 
                iterator=False, 
                chunksize=None, 
                compression='infer', 
                thousands=None, 
                decimal='.', 
                lineterminator=None, 
                quotechar='"', 
                quoting=0, 
                doublequote=True, 
                escapechar=None, 
                comment=None,
                encoding=None,
                dialect=None, 
                error_bad_lines=True, 
                warn_bad_lines=True,
                delim_whitespace=False, 
                low_memory=True, 
                memory_map=False, 
                float_precision=None, 
                storage_options=None)

CSV 파일을 pandas로 읽어온다.
CSV(Comma-Separated Values)는 일반적으로 ,(comma)로 구분된 파일을 의미한다.


  • filepath_or_buffer
    불러올 데이터의 경로를 지정한다. 파일의 위치나 웹 주소를 통해 불러올 수 있다.
  • sep
    default는 ,로 csv파일의 구분자를 지정한다.
  • header
    column name이 있으면 default 값인 infer를 사용하지만,
    column name이 없으면 None을 할당한다. column names가 없을 때 None을 할당하지 않으면 첫 번째 행을 column names로 인식한다.
    column name
    indexvalues(0,0)
  • index_col
    row label로 사용할 column을 지정한다.
  • encoding
    windows에서 한글 파일로 작성된 경우 utf8 또는 cp949를 지정해야 오류 없이 읽어올 수 있다.
data = pd.read_csv

pandas.read_csv

2. to_csv

pandas data를 CSV로 저장한다.

.to_csv(path_or_buf=None, 
        sep=',', 
        na_rep='', 
        float_format=None,
        columns=None, 
        header=True,
        index=True, 
        index_label=None, 
        mode='w', 
        encoding=None, 
        compression='infer', 
        quoting=None, 
        quotechar='"', 
        line_terminator=None, 
        chunksize=None, 
        date_format=None, 
        doublequote=True, 
        escapechar=None, 
        decimal='.', 
        errors='strict', 
        storage_options=None)
  • path_or_buf
    저장할 데이터의 경로와 파일명을 지정한다.

pandas.DataFrame.to_csv
pandas.Series.to_csv

0개의 댓글