[Python] pandas 이용하여 엑셀 나누기

haremeat·2021년 9월 30일
0

Python

목록 보기
2/5
post-thumbnail
import pandas as pd
import numpy as np

chunksize = 나누고 싶은 개수
i = 0
df = pd.read_excel("엑셀 경로")
for chunk in np.array_split(df, len(df) // chunksize):
    chunk.to_excel('./excel/excel_{:02d}.xlsx'.format(i), index=True)
    i += 1

몇 개 기준으로 나눌지 chunksize에 넣어주면 된다.
10000을 넣으면 10000개의 데이터를 가진 엑셀파일이 n개 생성된다.

최근 업무상 데이터가 45만개가 넘는 엑셀 파일을 파싱해야 할 일이 있었는데
한번에 넣으니까 time error 생기고 시간이 너무 오래 걸려서 파일을 나눠야했다.
그때 사용한 코드다.

코드를 실행하면 chunk.to_excel에 명시된 경로에 나뉜 엑셀 파일이 생성된다.

profile
버그와 함께하는 삶

0개의 댓글