extract zip files in colab

eunbi kim·2024년 6월 27일
0
post-custom-banner

구글 드라이브에 압축파일을 업로드하고 코랩에서 풀어주는 과정이다.

구글 드라이브에 연결해주고

from google.colab import drive

drive.mount('/content/drive')

압축 풀어줄 폴더로 이동하고

cd 'unzip_path'

압축파일(zip파일)이 있는 경로를 지정하여 unzip 명령으로 압축 해제한다.

!unzip -qq 'filepath/filename.zip' 

or... zip파일 경로, 압축 해제할 경로 지정한 후 zipfile로 풀어준다.

import zipfile

zip_file_name = 'filepath/filename.zip'
extraction_dir = 'unzip_path'

with zipfile.ZipFile(zip_file_name, 'r') as zip_ref:
    zip_ref.extractall(extraction_dir)

둘 다 해봤는데 unzip이 더 빠른 것 같았다.

.
.
.

추가 (삽질일기) :

MyDrive에 압축 해제한 파일/폴더들이 자꾸 사라지는 현상 발생
분명 전날 약 20개 폴더가 압축해제되고 파일 개수까지 잘 확인했는데
다음날 다시 드라이브에 접속해보니 몇 개의 폴더가 누락되어 있었다.

나는 인정할 수 없다,,,,,,,,,,,,,,,,,,,,,,,,,,,,

-> 동기화 과정 중 오류, 압축 파일이 너무 커서 생기는 문제로 추정

-> 로컬에서 zip파일 내의 폴더별로 나눠서 개별적으로 압축 해제... (시간 짱 오래 걸림. 이러기 싫어서 colab에서 unzip했던 건데 결국 이런 최후를 맞이했다.)

post-custom-banner

0개의 댓글