[Chapter 01] 데이터 분석을 시작하며 - 2 구글 코랩과 주피터 노트북

Kim Seohyun·2023년 1월 7일
0
post-thumbnail

코랩, 노트북, 구글 드라이브, 깃허브, 마크다운
이 책의 모든 코드는 웹 브라우저에서 파이썬 코드를 실행할 수 있는 구글 코랩을 사용하여 작성되었습니다. 본격적으로 데이터 분석을 배우기 전에 구글 코랩을 소개하고 간단한 사용법을 익혀 보겠습니다.

구글 코랩

구글 코랩이란

코랩(Colab)은 구글이 대화식 프로그래밍 환경인 주피터 노트북(Jupyter Notebook)을 커스터마이징한 것으로 웹 브라우저에서 파이썬 코드를 작성하고 실행할 수 있다. 구글 코랩과 주피터 노트북을 간략하게 비교하면 다음 표와 같다.

특징구글 코랩주피터 노트북
설치클라우드 기반이므로 설치 불필요내 컴퓨터에 설치
실행 환경인터넷이 연결된 웹 브라우저오프라인 상태의 웹 브라우저
파일 저장구글 드라이브에 자동 저장내 컴퓨터 하드 디스크에 저장
패키지사전 설치되어 제공패키지 관리자로 직접 설치

작성한 코랩 파일은 노트북(Notebook) 혹은 코랩 메모장이라고도 부른다. 본 학습 과정에서는 노트북이라는 용어로 통일하여 사용한다. 노트북을 사용하면 코드를 설명하는 문서를 따로 만들지 않고 코드와 텍스트, 심지어 코드 실행 결과까지 함꼐 담을 수 있다. 따라서 다른 사람에게서 노트북을 받으면 코드를 실행할 필요 없이 코드 설명과 실행 결과를 바로 확인할 수 있다.

사용법

사용을 위해서는 구글 계정이 반드시 필요하다. 계정이 있다면 구글 코랩 웹 페이지에 접속해보자. 다음, 구글 코랩 웹 페이지의 오른쪽 상단에서 [로그인] 버튼을 클릭하여 구글 계정에 로그인한다. 기본 시작 페이지는 다음과 같다.

기본 구성

  • 맨 위에는 노트북 제목이 쓰여 있다. 노트북 제목은 파일 이름으로도 사용된다.
  • 제목 아래에는 메뉴바가 있고, 화면 왼쪽에는 현재 노트북의 목차가 있다.
  • 화면 오른쪽에는 노트북의 셀이 있다. 노트북에서 셀(Cell)은 코드 또는 텍스트의 덩어리라고 보면 된다. 노트북은 보통 여러 개의 코드 셀과 텍스트 셀로 이루어진다.
  • 선택된 셀은 그림자가 나타나기 때문에 쉽게 알아챌 수 있다.
  • 셀은 키보드 ⬆, ⬇ 키를 누르거나 마우스를 클릭해서 이동할 수 있다.
  • 목차 창의 [X] 아이콘을 클릭하여 목차를 닫으면 셀 화겸능 확장할 수 있다.

텍스트 셀 사용법

  • 텍스트 셀을 수정하려면 원하는 셀로 이동한 후 ENTER 키를 누르거나 마우스로 더블 클릭하면 편집할 수 있다. 왼쪽 창에서 텍스트를 수정하면 오른쪽 미리보기에서 수정된 결과를 바로 볼 수 있다.
  • 텍스트 셀의 수정을 끝내려면 ESC 키를 누르거나, 마우스로 노트북의 다른 셀을 클릭하면 된다.
  • 텍스트 셀에는 HTML과 마크다운을 혼용해서 사용할 수 있다.


코랩에서 제공하는 텍스트 셀 툴바를 사용하면 다양한 형태로 글을 꾸밀 수 있다. 맨 왼쪽부터 순서대로 제목 전환, 굵게, 기울임꼴, 코드로 형식 지정, 링크 삽입, 이미지 삽입, 들여쓰기, 번호 매기기 목록 추가, 글머리기호 목록 추가, 가로줄 추가, LaTeX, 이모티콘 삽입, 마크다운 미리보기 위치 변경이다.

현재 선택한 셀의 오른쪽 위에는 현재 셀에 적용할 수 있는 기능이 아이콘으로 표시된다. 맨 왼쪽부터 순서대로 위로 셀 이동, 아래로 셀 이동, 셀에 연결, 편집기 설정 열기, 수정, 탭에서 셀 미러링, 셀 삭제, 셀 작업 더 보기이다.

코드 쉘 사용법

  • 코드 쉘로 포커스를 이동한 후 ENTER 키를 누르거나 마우스로 한 번 클릭하면 바로 코드 쉘을 편집할 수 있다.
  • 코드 쉘을 실행할 때는 셀 왼쪽의 ▶ 아이콘을 클릭하거나 CTRL+ENTER 키를 누른다. 코드 쉘은 마지막 라인의 실행 결과를 셀 아래에 출력한다.
  • SHIFT+ENTER 키를 연속해서 누르면 현재 셀을 실행하고 바로 다은 셀을 이어서 실행할 수 있다.
  • ALT+ENTER 키를 누르면 코드 셀을 실행하면서 바로 다음에 새로운 코드 셀을 추가할 수 있다.
  • 노트북은 처음부터 끝까지 순서대로 모든 코드가 실행되는 일반 프로그램과 다르게 코드를 셀 단위로 실행할 수 있다. 따라서 위아래 셀을 오가며 코드를 실행하면 변수값이 기대한 겂과 다른 값을 가지게 될 수 있으므로 코드를 실행할 때 순서에 주의해야한다.

노트북

코랩 노트북은 구글 클라우드 가상 서비를 사용한다. 아래 사진과 같이 노트북 메뉴바의 오른쪽에 있는 RAM, 디스크 아이콘에 마우스 커서를 올리면 연결된 런타임에 대한 정보를 얻을 수 있다. 만약 이 부분이 [연결]로 되어있다면 클릭해서 런타임을 연결하면 된다.

아래와 같이 커서를 올리면 현재 노트북이 구글 클라우드의 Compute Engine에 연결되어 있다는 것, RAM과 디스트 사용율도 추가적으로 알 수 있다.

구글 계정만 있으면 코랩 노트북을 사용해 무료로 가성 서버를 활용할 수 있다. 단, 동시에 사용할 수 있는 구글 클라우드의 가성 서버는 최대 다섯 개로 제한된다. 다섯 개 이상의 노트북을 열어야 한다면 실행 중인 노트북을 저장하고 런타임과 연결을 끊어야 한다. 또한 한 개의 노트북을 12시간 이상 실행할 수 없다.

새 노트북 만들기

새로운 노트북을 만들고 저장하는 방법을 알아보자.

  1. 노트북 화면에서 [파일] - [새 노트] 메뉴를 선택하면 새로운 노트북을 만들 수 있다.
  2. 웹 브라우저의 새로운 탭에 'Untitled0.ipynb'란 이름의 새로운 노트북이 열리면 빈 코드 셀 하나가 들어있다.
  3. 노트북은 컴퓨터에 다운로드하거나 구글 드라이브에 저장할 수 있다. 컴퓨터에 다운로드 하려면 [파일] - [다운로드] 메뉴를 선택한다. 확장자가 ipynb인 주피터 노트북 파일이나 일반 파이썬 스크립트인 py 파일로 다운로드할 수 있다. 구글 드라이브에 저장하고 싶다면 [파일] - [저장] 메뉴를 선택한다.
  4. 노트북을 구글 드라이브에 저장하면 내 구글 드라이브의 [내 드라이브] - [Colab Notebooks] 폴더에서 확인할 수 있다.

저장된 노트북을 코랩으로 불러올 수도 있다. 구글 드라이브에서 노트북을 더블 클릭합니다. 또는 노트북을 선택한 후 마우스 오른쪽 버튼을 클릭하여 [연결 앱] - [Google Colaboratory]를 선택하면 노트북을 구글 코랩에서 열 수 있다.

깃허브에 저장된 노트북 불러오기

깃허브(GitHub)에 있는 주피터 노트북을 다운로드하거나 깃허브 저장소를 클론(Clone)하여 사용할 수 있지만 간단하게 코랩에서 바로 실행하는 방법도 있다.

  1. 주피터 노트북이 있는 깃허브 저장소의 [Code] 탭에서 열고자 하는 파일을 클릭한다.
  2. 깃허브에서 노트북 내용을 바로 확인할 수 있다. 또는 [구글 코랩(Colab)에서 실행하기] 링크를 클릭해서 코렙 페이지에서 내용을 확인, 실행, 수정, 다운로드 등 할 수 있다.

좀 더 알아보기

텍스트 셀의 텍스는 툴바로 편집할 수 있지만, 마크다운을 활용하여 편집할 수도 있다. 코랩에서 사용할 수 있는 마크다운 서식은 다음과 같다.

마크다운 서식

마크다운 서식설명예시
# 제목1<h1> 태그와 동일
## 제목1<h2> 태그와 동일
### 제목1<h3> 태그와 동일
#### 제목1<h4> 태그와 동일
##### 제목1<h5> 태그와 동일
**혼공분석**글씨 굵게혼공분석
*혼공분석* 또는 _혼공분석_글씨 기울임꼴혼공분석
~~혼공분석~~취소선 추가혼공분석
`print("Hello World!")`코드 서체
> 혼공분석들여쓰기
* 혼공분석 또는 - 혼공분석글머리기호 목록
[한빛미디어](http://www.hanbit.co.kr/)링크 생성한빛미디어
![한빛미디어](http://www.hanbit.co.kr/images/common/logo_hanbit.png)이미지 추가한빛미디어
$y = x \times z$레이텍 추가y=x×zy = x \times z

정리

5가지 키워드로 정리하는 핵심 포인트

  • 코랩: 구글 계정을 가지고 있다면 누구나 사용할 수 있는 웹 브라우저 기반의 파이썬 코드 실행 환경
  • 노트북: 코랩의 프로그램 작성 파일로 일반 프로그램 파일과 달리 대화식으로 프로그램을 만들 수 있기 떄문에 데이터 분석이나 교육에 매우 적합하며 노트북에는 코드, 코드 실행 결과, 문서를 모두 저장하여 보관 가능
  • 구글 드라이브: 구글이 제공하는 클라우드 파일 저장 서비스로, 코랩에서 만든 노트북을 구글 드라이브의 'Colab Notebooks' 폴더에 저장할 수 있고 필요할 때 다시 코랩에서 열 수 있음
  • 깃허브: 분산 버전 관리 툴인 깃의 저장소를 호스팅하는 웹 서비스로, 코드 수정 이력을 버전별로 관리할 수 있고 여러 사람이 공동으로 작업하기 편리한 환경을 제공
  • 마크다운: HTML과 같이 일반 텍스트로 서식있는 문서를 작성하는 데 사용
profile
EWHA Cyber Security 19

0개의 댓글