[SQL 분석] CH 1. 공공 데이터를 통한 시장 동향 이해해보기 : 반복 작업 처리

이진호·2024년 10월 24일

제로베이스 데이터 분석 부트캠프

목록 보기

58/89

반복 작업 처리

만약, 여러 csv 파일에 대해 동일한 작업을 해주어야 한다면 아래 코드 활용하기

# src는 작업할 csv파일이 있는 디렉토리의 경로
# dest는 작업 완료한 csv파일을 저장할 디렉토리의 경로

files = os.listdir(src)

for f in files:
  print(f)
  df = pd.read_csv(os.path.join(src, f), encoding = 'cp949')

  result = df.melt(df.columns[0:3], var_name='날짜', value_name='거래액')

  result = result[result[result.columns[0]]!='합계']
  result = result[result[result.columns[2]] != '계']
  result = result[result[result.columns[1]] == '소계']
  result = result.drop(result.columns[1], axis = 'columns')
  result['날짜'] = result['날짜'].apply(lambda x: x.replace(" p)", ""))
  result['날짜'] = result['날짜'].apply(lambda x: x.replace(".", "/"))
  
  # 전처리 완료한 파일 저장
  result.to_csv(os.path.join(dest, f), encoding='cp949', index = False)

이진호

이전 포스트

[SQL 분석] CH 1. 공공 데이터를 통한 시장 동향 이해해보기 : 전처리

다음 포스트

[SQL 분석] CH 1. 공공 데이터를 통한 시장 동향 이해해보기 : 반복 작업 처리

제로베이스 데이터 분석 부트캠프

반복 작업 처리

[SQL 분석] CH 1. 공공 데이터를 통한 시장 동향 이해해보기 : 전처리

[SQL 분석] CH 1. 공공 데이터를 통한 시장 동향 이해해보기 : 차트 생성해보기

0개의 댓글