본 포스팅은 KT 에이블스쿨 교육내용을 바탕으로 제 나름대로 정리하여 작성하였습니다.
파이썬을 이용하면서 다수의 파일들을 다뤄야 할 때 유용한 모듈이다.
사용자가 제시한 조건에 맞는 파일들을 list
형식으로 반환해준다.
from glob import glob
*
과 ?
를 이용하여 조건을 제시할 수 있다.
*
임의 길이의 모든 문자열
?
한자리의 문자열
glob와 for
문을 이용하여 판다스의 데이터프레임을 한번에 불러올 수 있다.
import pandas as pd
from glob import glob
file_names = glob("생활이동_자치구_202212/*.csv") #1
total = pd.DataFrame() #3.1
for file_name in file_names:
temp = pd.read_csv(file_name, encoding='cp949') #2
total = pd.concat([total, temp]) # 3.2
#1
생활이동_자치구_202212 디렉토리에 있는 .csv
확장자를 가진 모든 파일들을 읽어온 뒤, file_names
라는 변수에 list
로 저장시켜준다.
#2
file_name
의 요소로 for
문을 작성하여 read_csv
메소드를 이용해 csv 파일을 읽은 뒤, temp 변수에 저장한 뒤,
#3
미리 저장한 빈 데이터 프레임인 total
변수에 concat()
함수를 이용하여 세로로 합쳐주는 행위를 for
으로 반복했다.