Google Colab 사용법

Google Colab은 기본적으로 Jupyter Notebook(IPython)과 사용법이 거의 같다.

그렇다면 굳이 왜 쓰는가?

편리하다, 쉽다, 여러가지 기능 사용이 가능하다.

우선 Colab을 이용하면 많은 라이브러리들을 설치하지 않아도 된다.

GPU 사용으로 빠른 실행이 가능하다.

딥러닝을 하다보면 학습을 시키는 과정에서 굉장한 시간이 소요되는데 이 때 구글에서 제공되는 GPU를 사용하여 빠른 속도로 런타임을 실행 가능하다.

일단 사용법부터 알아보자

바쁘신분은 그림만 봐도 충분히 사용 가능하다.


우선 구글 드라이브에 간다
주소창에 위와 같이 치거나

구글 홈페이지에서 우측 상단 \vdots\vdots\vdots 버튼을 누르면 이곳에 드라이브가 있다.
구글 드라이브는 15G까지 기본적으로 제공되고 그 이상의 용량은 추가 결제 또는 학생일 경우 학교 메일을 통해 무제한 까지 용량을 제공받을 수 있다.


드라이브에 접속 후 코랩 사용을 위한 폴더를 위와 같이 생성한다. 드라이브 바탕에 우클릭을 하면 위의 메뉴가 나오고 새 폴더 버튼을 클릭하면

이러한 창이 뜨고 폴더명을 설정해 준 후 만들기를 누르면 생성된다.
![](https://images.velog.io/images/s6820w/post/d93384e0-89ea-4438-a0aa-새로 만든 폴더에서 우클릭을 하면 동일한 메뉴가 나오는데

더보기를 선택하면 +연결할 앱 더보기 가 나온다.

우측에 +버튼을 눌러도 아래와 같은 동일한 창이 뜬다.

클릭하면 위와 같은 창이 뜨고 검색창에 colaboratory를 검색하자

검색하면 다음과 같은 창이 뜨고 설치를 누르면

이러한 창이 뜨고 계속을 누른다.

계정을 선택하여 로그인한다.

확인을 누른다.

완료를 누른다.

설치 끝. 준비 끝.


위와 같이 Google Colaboratory 버튼을 눌러 ipynb파일을 생성한다. colab은 기본적으로 Jupyter Notebook 파일, 즉 .ipynb의 확장자 명의 파일이 생성된다.

참고로 현재는 python2는 더이상 지원을 하지않고 python3만 지원 가능하다.
파일은 Untitled0.ipynb라는 파일명으로 기본적으로 생성되고 해당 폴더에 이미 Untitled파일이 존재한다면 존재하는 수 만큼 +n 되어 Untitled1, Untitled2와 같은 형태로 생성된다.

파일명을 클릭하면 파일명 변경이 가능하다.

또한 드라이브에서 파일 우클릭으로 이름 바꾸기를 통해 변경 가능하다.

우선 이 파일 자체에서 파일 작성이 가능하다.
코랩의 장점은 로그인만 하면 파일을 로컬드라이브에 저장하지 않고 컴퓨터가 있다면 어느 컴퓨터든 어디서나 사용 가능하다.
또 하나의 장점은 읽어올 파일 또한 드라이브에 저장하여 사용 가능한데, 파일을 읽기 위해 드라이브에 mount시켜야한다.

mount (유닉스) : mount 명령어는 운영 체제에게 파일 시스템이 사용 준비가 되어있음을 지시하고 이를 전반 파일 시스템 계층 구조(마운트 지점)에 있는 특정 지점에 연결시킨 다음, 접근에 관련한 옵션을 설정한다. 마운트를 통해 파일 시스템, 파일, 디렉터리, 장치, 특수 파일을 사용자가 사용할 수 있게 한다. 이와 반대되는 명령어인 umount는 운영 체제에게 파일 시스템을 마운트 지점으로부터 연결을 해제할 것을 지시하며 컴퓨터로부터 분리되어 더 이상 접근을 하지 못하게 한다.
출처 : https://ko.wikipedia.org/wiki/Mount_(%EC%9C%A0%EB%8B%89%EC%8A%A4)

간단히 말해 mount는 외부 경로와 연결시켜 준다고 생각하면 된다.

1-1 가장 간단한 방법


좌측의 폴더 모양을 선택한 후 오른쪽 구글드라이브 모양의 파일 버튼이 있는데 그곳을 누르면 드라이브 마운트라는 설명이 뜨고 그곳을 누른다.


다음과 같은 창이 뜨고 GOOGLE 드라이브에 연결을 누르면 mount가 완료된다.

완료되면 위와같은 창이 뜨고 드라이브 마운트 해제를 누르면 mount가 해제된다.


이 방법은 가끔 이런 상태가 지속되어 가장 빠른방법이 아닌 경우도 발생한다.
그럴 때는 아래와 같은 방법을 사용하자.
검색을 하면 위의 방법은 찾지 못했는데 최신방법이 아닐까 생각한다

1-2 명령어를 사용한 방법

코랩에서는 터미널에서 사용하는 명령어들을 사용 가능하다.
그와 유사하게 명령어를 사용 가능한데

[1], [2], [3] 3가지 모두 mount하는 방법이다.

이 중 편한것을 쓰시면 된다.

기본적으로 경로는 위와같이 '/content/drive/'와 같이 시작되는데, /content.으로 대체 가능하다. .은 앞의 경로를 생략할 때 쓰인다.
좀 더 명확히 표현하기 위해 [3]의 방법처럼 '/content/drive'와 같이 사용하기도 한다.
일단 셋 중 하나의 방법으로 shift + enter를 하게되면 1개의 셀을 실행하게 되고 위와 아래와 같이 나온다. 전체의 셀을 처음부터 실행하고 싶을 때는 Ctrl + F9를 누른다.
또 다른 경로 복사하는 방법
위 사진에 보면 파일에 마우스 커서를 대면 \vdots 같은 모양이 나온다.

누르면 이같은 메뉴가 나오고 경로복사를 누른다
그러면 datapath 지정시 ''를 치고 그 안에
'사이에 복사한 경로를 붙여넣기하면
필요한 경로가 완성된다.
예를 들면 '/content/drive'
이런경우에는 /content/drive가 복사되고 ''사이에 복사된 것을 넣는것이다.


실행하면 위와 같은 창이 뜨게되는데 파란색의 주소창을 누르면

이러한 창이 뜨게되고
계정 하나를 로그인하게되면 항상 매번 마운트시에 로그인 해야하는 번거로움이 있다

이러한 창이 뜨게되고 허용을 누른다.

우측의 네모 버튼을 누르면 자동으로 코드가 복사된다.

복사된 코드를 Enter verification code: 옆의 네모칸에 붙여넣기Ctrl + v 한 후 enter를 치면 mount가 완료된다.

이미 mount가 되면 위와 같이 Drive already mounted at ...과 같이 뜬다.

로컬드라이브(컴퓨터의 드라이브) - C드라이브, D드라이브...- 에서 파일을 끌어다 구글 드라이브에 놓으면 다음과 같이 뜨고

이러한 모습으로 완료된다.
위를 보다시피 경로는 내 드라이브 > Kaggle이다.

위에서의 My Drive내 드라이브 이다.

우선 파일을 읽어오기 위해 pandas를 사용하고 위와 같은 방식으로 import(불러오기)한다.
불러오기를 위해 셀을 실행해야 한다 왼쪽의 재생버튼 모양을 누르거나 위에서 언급한 셀 실행방식을 사용한다.
파일의 경로를 위와 같이 변수에 저장하면 나중에 편하다

이러한 명령어를 사용하여 읽어온다pd.read_csv() pd판다스를 이용하여read_csv, 즉 csv(Comma-Separated-Values) 쉼표로 구분된 파일을 읽는 함수를 이용하여 ()안의 경로의 파일을 읽는다는 의미이다.
안의 경로는 str형태로 되어있어야 하고, str + str의 형태로 경로 + 파일명을 연결해 주고 괄호안에 경로(path)명을 한번에 써도 된다.
df(Data Frame) 라는 변수에 DataFrame을 저장하고 다음 줄에 그것을 출력했다.

상단 메뉴에 보면 이러한 메뉴가 있는데 런타임 유형 변경이 가능하다

기본 설정은 None(CPU)이고 GPU(그래픽카드)를 통해 빠른 실행이 가능하다. 위에서 저장을 누르면 GPU로 실행 가능하다. 현재는 Tesla K80을 제공한다.

TPU는 구글에서 만든 것인데 다음과 같다.
Cloud 텐서 처리 장치(TPU)
TPU(텐서 처리 장치)는 Google에서 맞춤 개발한 ASIC(Application-Specific Integrated Circuits)로서 머신러닝 작업 부하를 빠르게 처리하는 데 사용됩니다. TPU는 Google이 머신러닝 분야에서 쌓은 심화된 경험과 경쟁력을 바탕으로 설계되었습니다.

Cloud TPU를 사용하면 TensorFlow를 통해 Google의 TPU 가속기 하드웨어에서 머신러닝 워크로드를 실행할 수 있습니다. Cloud TPU는 연구원, 개발자, 기업이 CPU, GPU, TPU를 사용할 수 있는 텐서플로우 컴퓨팅 클러스터를 빌드할 때 최대의 성능과 유연성을 발휘하도록 설계되었습니다. 고급 Tensorflow API 덕분에 Cloud TPU 하드웨어에서 모델을 쉽게 실행할 수 있습니다.
출처 : https://cloud.google.com/tpu/docs/tpus?hl=ko
빠르고 좋다고 한다

우측의 항목이

위와 같이 변한다.

우측상단의 환경설정 항목을 통해 테마를 변경 가능하다.
위의 화면은 dark 테마이다.

편집기 항목을 통해 글자 크기와 글씨테마 등을 선택 가능하다.
Colab Pro는 결제 하면 더 빠르고 기본적으로 로그인이 12시간 지속되는데 24시간 까지 사용 가능하다. 어차피 미국에서만 가능하다
기타 메뉴에는

같은 메뉴가 있는데 power

3가지가 있고 No power는 아무것도 나오지 않고 다른것을 선택하면

타자 칠때마다 이렇게 불꽃이 튀기고 콤보가 기록된다.
Some powerMany power는 튀기는 불꽃의 정도 차이이다.

위에서 코기 모드아기고양이 모드를 선택하면

이렇게 위에 웰시코기(?)와 고양이가 각각 돌아다니고 이중 하나만 선택도 가능하다.

처음 포스팅한 글이라 두서 없지만 최대한 자세히 쓰려고 노력했다.
앞으로는 얼마나 대충 쓸지 모르지만

잘못된 내용은 댓글로 남겨주세요

profile
http://s6820w.tistory.com/ 로 블로그 이전

1개의 댓글

comment-user-thumbnail
2020년 7월 30일

덕분에 잘 세팅했습니다!

답글 달기