[python] pandas로 json 데이터 다루기

남영민·2021년 12월 14일
0

api로 데이터를 받으면, json 형태로 데이터가 들어가 있어 가공하기 편한 형태로 변환 후 적재가 필요한 경우가 있습니다.

ast.literal_eval("json_string")을 사용하면, 문자열을 읽어서 파이썬의 기본 타입(dict와 list 같은)으로 변경합니다. 형식을 맞추기 위해 replace를 활용하여 json_string을 수정해줄 필요가 있을 수 있습니다.

ast.literal_eval로 json_string을 딕셔너리 형태로 변경 후 json_normalize() 함수를 사용하면 딕셔너리의 key를 열로, value를 값으로 만들 수 있습니다.

json_transformed_df = json_normalize(required_union_df['Event_Value'].apply(ast.litral_eval()).tolist())

json_mormalize() 사용 후 reindex로 필요한 열만 남깁니다.

json_transformed_df = json_transformed_df.reindex(columns=["category", "revenue"])
profile
성장하는 개발자

0개의 댓글