WDSM_3_데이터 다운로드 with Colab

new_chall·2021년 7월 27일
0

데이터 다운로드

코랩을 통해서 데이터를 다운로드하고, 압축을 푸는 과정까지 진행해보겠습니다.

1. 접속정보 입력

  1. Kaggle 폴더를 생성합니다.
  2. 토큰이 Json 파일이기 때문에 json 모듈을 설치합니다.
  3. 캐글 폴더에 토큰을 생성합니다.
!mkdir ./kaggle
import json
token = {"username":####,"key":####}

with open('/content/kaggle/kaggle.json', 'w') as file:
    json.dump(token, file)
  • 토큰은 Kaggle > Account에서 다운로드 받을 수 있습니다.

2. 경로 지정

!chmod 600 ./kaggle/kaggle.json
!cp /content/kaggle/kaggle.json ~/.kaggle/kaggle.json
!kaggle config set -n path -v{/content}

3. 구글드라이브 연동

from google.colab import drive
drive.mount('/gdrive')

4. 파일 경로 수정

cd ../gdrive/My Drive/Kaggle/WSDM_210815/data

5. 파일 다운로드

!kaggle competitions download -c kkbox-churn-prediction-challenge

6. 파일 체크

!p7zip -d {/content}/competitions/kkbox-churn-prediction-challenge/user_logs.csv.7z

7. 압축 해제(sample) 및 파일 이동 (skip)

7z로 압축이 되어있기 때문에 그에 맞는 압축해제를 진행
-d 는 압축 해제 후 파일 삭제 옵션임

!p7zip -d ./kkbox-churn-prediction-challenge/user_logs.csv.7z

8. 파일 확인

!ls ./kkbox-churn-prediction-challenge

9. unzip and delete

!p7zip -d ./kkbox-churn-prediction-challenge/members_v3.csv.7z
!p7zip -d ./kkbox-churn-prediction-challenge/train.csv.7z
!p7zip -d ./kkbox-churn-prediction-challenge/transactions_v2.csv.7z
!p7zip -d ./kkbox-churn-prediction-challenge/sample_submission_v2.csv.7z
!p7zip -d ./kkbox-churn-prediction-challenge/train_v2.csv.7z	    
!p7zip -d ./kkbox-churn-prediction-challenge/user_logs_v2.csv.7z
!p7zip -d ./kkbox-churn-prediction-challenge/sample_submission_zero.csv.7z  
!p7zip -d ./kkbox-churn-prediction-challenge/transactions.csv.7z 
profile
데이터 분석가, 태블로 개발자

0개의 댓글