pd.read_csv 시 NaN 값 None으로 바꾸기

햄도·2020년 12월 3일

간단하게 read_csv()의 인자로 keep_default_na=False를 넣어주면 해결된다.

keep_default_na를 False로 설정하면, missing value에 na_values 인자에 설정된 값을 넣어주고, na_values 인자의 기본값은 None이기 때문에 NaN은 None으로 바뀐다.

test_set = pd.read_csv(args.test_set_path
                      , names=[
                          'item_no',
                          'item_nm',
                          'brand_id',
                          'brand_nm',
                          'model_nm',
                          ]
                      , dtype={
                          'item_no':str,
                          'item_nm':str,
                          'brand_id':str,
                          'brand_nm':str,
                          'model_nm':str,
                      }
                      , sep='^'
                      , header=1
                      , keep_default_na=False)\
          .loc[:,['item_no','item_nm', 'brand_nm', 'model_nm']]

참고

https://stackoverflow.com/questions/10867028/get-pandas-read-csv-to-read-empty-values-as-empty-string-instead-of-nan

햄도

developer hamdoe

이전 포스트

Python inner functions: what are they good for?

다음 포스트

pd.read_csv 시 NaN 값 None으로 바꾸기

Python inner functions: what are they good for?

python docstring 가이드

0개의 댓글