본 포스팅은 KT 에이블스쿨 교육내용을 바탕으로 제 나름대로 정리하여 작성하였습니다.
파이썬을 이용하면서 다수의 파일들을 다뤄야 할 때 유용한 모듈이다.
사용자가 제시한 조건에 맞는 파일들을 list 형식으로 반환해준다.
from glob import glob
* 과 ? 를 이용하여 조건을 제시할 수 있다.
* 임의 길이의 모든 문자열
? 한자리의 문자열
glob와 for 문을 이용하여 판다스의 데이터프레임을 한번에 불러올 수 있다.
import pandas as pd
from glob import glob
file_names = glob("생활이동_자치구_202212/*.csv") #1
total = pd.DataFrame() #3.1
for file_name in file_names:
temp = pd.read_csv(file_name, encoding='cp949') #2
total = pd.concat([total, temp]) # 3.2
#1
생활이동_자치구_202212 디렉토리에 있는 .csv 확장자를 가진 모든 파일들을 읽어온 뒤, file_names 라는 변수에 list 로 저장시켜준다.
#2
file_name 의 요소로 for 문을 작성하여 read_csv 메소드를 이용해 csv 파일을 읽은 뒤, temp 변수에 저장한 뒤,
#3
미리 저장한 빈 데이터 프레임인 total 변수에 concat() 함수를 이용하여 세로로 합쳐주는 행위를 for 으로 반복했다.