Google Colab에서 이미지 데이터셋 사용

송승관·2021년 7월 8일
2

Colab에서 이미지 데이터셋을 사용하려면 Google Drive에 업로드해야 한다. 이미지 데이터셋 특성 상 많은 이미지가 한 레이블 당 포함되게 되고 압축없이 그대로 Google Drive에 업로드 시 파일 리스트를 업로드하고 검증하는 데 시간이 많이 소요된다. 이런 특성때문에 Colab에서 이미지 데이터셋을 사용하려면 압축하여 드라이브에 올리는 것이 합당하다. 드라이브에 압축한 파일을 올렸으면 압축해제하고 데이터셋을 사용하면 된다.

사용 방법

  1. 사용하려는 이미지 데이터셋을 선택하여 압축한다.

  2. 압축한 데이터셋을 Colab에 올린다.

    • Colab화면에서 11시 4번째 버튼에 Files가 있다. 거기서 첫번째 버튼(업로드)을 클릭하면 파일 업로드 선택창이 뜨는데 압축된 데이터셋을 선택하면 된다.
    • 드라이브 내 특정 위치에 업로드 할 경우, 구글 드라이브에서 그 위치에 압축된 데이터셋을 업로드하면 된다.

첫번째 버튼을 클릭하면 된다. 드레그 엔 드랍도 가능

  1. Colab에 올라간 압축 파일을 unzip을 사용해 원하는 위치에 해제한다.
    • Colab에서는 절대 경로로 데이터 위치를 지정하는 것이 좋다.(예시: /content/drive/MyDrive/dev/project1/dataset.zip)
    • 미리 생성하려는 경로에 폴더를 만들어놓자 (mkdir datasets)
!unzip -qq <압축 파일 경로> -d <원하는 위치 경로>  

사용 예시

!mkdir /content/drive/MyDrive/dev/project1/dataset
!unzip -qq /content/drive/MyDrive/dev/project1/dataset.zip -d /content/drive/MyDrive/dev/project1/dataset
profile
Data Engineer, 변화를 두려워하지 않는 개발자입니다.

0개의 댓글