glob

강달봉·2023년 2월 21일
0

이미지출처

본 포스팅은 KT 에이블스쿨 교육내용을 바탕으로 제 나름대로 정리하여 작성하였습니다.


파이썬을 이용하면서 다수의 파일들을 다뤄야 할 때 유용한 모듈이다.
사용자가 제시한 조건에 맞는 파일들을 list 형식으로 반환해준다.

import

from glob import glob

*? 를 이용하여 조건을 제시할 수 있다.

  • * 임의 길이의 모든 문자열

  • ? 한자리의 문자열


예시

glob와 for 문을 이용하여 판다스의 데이터프레임을 한번에 불러올 수 있다.

import pandas as pd
from glob import glob
file_names = glob("생활이동_자치구_202212/*.csv") #1
total = pd.DataFrame() #3.1

for file_name in file_names:
    temp = pd.read_csv(file_name, encoding='cp949') #2
    total = pd.concat([total, temp]) # 3.2
  • #1
    생활이동_자치구_202212 디렉토리에 있는 .csv 확장자를 가진 모든 파일들을 읽어온 뒤, file_names 라는 변수에 list 로 저장시켜준다.

  • #2
    file_name 의 요소로 for 문을 작성하여 read_csv 메소드를 이용해 csv 파일을 읽은 뒤, temp 변수에 저장한 뒤,

  • #3
    미리 저장한 빈 데이터 프레임인 total 변수에 concat() 함수를 이용하여 세로로 합쳐주는 행위를 for 으로 반복했다.

profile
이상한사람

0개의 댓글