음 지난번까지만해도 캐글 데이터셋 불러오는 방법을 되게 어려워했었던 것 같은데,
이번 연휴가 지나고 특이점이 왔는지 한번 다시 해보니까 뚝딱 되는 것을 알 수 있었다 ^^..
코랩/구글 드라이브에서 kaggle competition 데이터 다운로드 하지 않고 바로 가져오기 ~
참고로 dacon에서는 구글 드라이브 바로가기를 만들 수 있었다.
캐글도 그런 기능이 있지 않을까? 하다가 찾아보게 되었다.
까먹지 않게 빨리 정리해두자 ~!!
DATA: Dolphin and Whale Identification Competition 의 이미지 데이터
캐글에서 본인 어카운트로 들어가준다.
살짝 아래로 내려가서 API section으로 이동해줌
그리고 Create New API Token
을 눌러주면 kaggle.json
파일이 컴퓨터에 저장이 될 것임.
저장된 파일을 코랩에서 불러와야한다.
!pip install kaggle
from google.colab import files
files.upload()
이렇게 하면 파일을 선택하라고 하는데 , kaggle.json
파일을 선택해서 넣어주면 된다.
그러면 읽혀짐
이상태로 그냥 데이터셋을 가지고 오면 이런 에러가 뜬다.
따라서 여기서 시키는 대로 디렉토리를 만들어준다.
!mkdir -p ~/.kaggle
!cp kaggle.json ~/.kaggle/
!chmod 600 ~/.kaggle/kaggle.json
kaggle이라는 숨겨진 파일을 만들어서 그 안에 json파일을 카피하고 권한을 설정해준다.
위의 이미지에선 실행을 안시켰는데 이걸 실행시킨다음에 이미지를 들고 오면
이렇게 들고와진다.
이미지는 쓰여진대로 /content안에 들어있다.
여기 있슴!
++ 아 근데 이미지 다 안들어오는 것 같음..
zip 파일로 된 것들은 잘 들어오는데 이런 competition처럼 zip파일로 안되어있는 아이들은 한번에 들어오는 것 같지 않네여..
zip파일이 아니라면 다른 방법을 찾아봐야 할듯..