📌 파이썬으로 데이터 분석하는 방법
1. 용어는 최대한 영어로 익히기.
2. 손으로 익히기.
3. 검색 능력 키우기.
4. 목표 세우기.
5. 커뮤니티 활용하기.
6. 엉덩이로 공부하기.
- 구글에 구글 드라이브 검색하고, 구글 계정 가입하기.
- Google Colaboratory 설치하기.
원격에 있는 구글이 가진 서버를 이용해서 데이터 분석을 하는 것이다. 개인 노트북 스펙이 아닌 구글 서버 스펙이므로, 설치 과정이 복잡하지 않다.
딥러닝의 주요 장치 CPU와 GPU
- CPU
컴퓨터의 두뇌라고 생각하면 쉽다.
- GPU
병렬 처리에 특화 > 행렬에 특화 > 딥러닝에 특화
GPU 기능을 사용하고 싶으면
A. 수정 > 노트 설정 > 하드웨어 가속기 > GPU 설정
댓글 기능이 있기 때문에, 옆에 코멘트를 남길 수 있다.
링크를 통하여 공유도 가능하다. 그러나 "뷰어" 모드로 해놔야 원본 유지가 가능하다.
!python --version 이용해서 버전을 확인해보니,
내가 데이터 분석하면서 쓸 버전은 3.7.12이다.
셀의 종류 | 설명 |
---|---|
코드 셀 | 코드 실행을 위한 셀 |
텍스트 셀 | 주석을 달거나, 설명 문구 등을 달기 위한 텍스트 전용 셀 |
단축키 | 단축키 설명 |
---|---|
ctrl M A | 셀 위에 셀 추가하기. |
ctrl M B | 셀 아래 셀 추가하기. |
ctrl M M | 텍스트 셀로 변경하기. |
ctrl M Y | 코드 셀로 변경하기. |
ctrl M D | 셀 제거하기. |
ctrl M Z | 바로 전에 했던 실행 취소하기. |
ctrl M H | 모든 단축키를 보여준다. |
shift enter | 코드 실행하고 다음 셀로 넘어가기. |
ctrl enter | 코드 실행하고 그 셀에 남아있기. |
alt enter | 코드 실행하고 셀 사이에 새로운 셀 만들어주기. 셀 사이에 공간이 없는 경우에 유용하다. |
HTML 경험이 없는 사람도 누구나 쉽게 서식을 추가할 수 있도록 만들어준 문서 편집 문법이다. 보고서를 작성할 때 가독성을 높여주는 역할을 수행한다. Velog markdown과 거의 동일하다.
from google.colab import files
myfile = files.upload()
import io
import pandas as pd
data = pd.read_csv(io.BytesIO(myfile['house_price.csv']))
data.head()
from google.colab import drive
drive.mount('/content/drive')
filename = '드라이브에서 파일의 경로를 복사 > 붙여넣기'
data = pd.read_csv(filename)
data.head()
드라이브에서 파일을 찾고, 그 경로를 복사 > 붙여넣기 하여 데이터를 불러오면 된다.
from IPython.display import Image
Image('이미지 경로 복사 > 붙여넣기')
from IPython.display import YouTubeVideo
YouTubeVideo('유튜브 코드키', 600, 380)
# 유튜브 코드키, 가로 길이, 세로 길이
+ 유튜브 코드키는 원하는 유튜브 영상의 링크를 보면 v= 뒤에 적힌 것이 유튜브 코드키이다.
from IPython.display import HTML
HTML('https://www.naver.com/')
웹사이트 페이지를 가져올 수 있다.
구글 서버를 이용해서 코딩하는 것이기 때문에 시행착오 없이 금방 금방 세팅할 수 있었다. 또한, HTML기능과 MarkDown기능을 잘 이용한다면, 가독성이 좋고 잘 정리된 보고서를 작성할 수 있을 것이다. 주의할 점은 메모리는 항상 확인하면서 이용하자. 애써 돌려놓은 모든 데이터가 날아가버릴 수도 있기 때문이다.