파이썬 : 데이터 과학 분야에 아주 적합한 프로그래밍 언어임
이 책에선 파이썬 3와 넘파이, matplotlib 라이브러리를 사용할 예정임
넘파이 : 수치 계산용 라이브러리
matplotlib : 그래프를 그려주는 라이브러리
파이썬 설치 방법 -> 아나콘다 배포판
아나콘다 배포판 : 데이터 분석에 중점을 둔 배포판(numpy와 matplotlib을 포함해 데이터 분석에 유용한 라이브러리 포함)
터미널에서 python이라고 작성하면 파이썬 인터프리터를 실행시킬 수 있음
1) 산술 연산

2) 자료형

3) 변수
파이썬은 동적 언어로 분류되는 프로그래밍 언어로, 자료형이 int라는 것을 명시하지 않아도 파이썬이 스스로 int임을 판단함

4) 리스트

슬라이싱 : 범위를 지정해 원하는 부분 리스트를 얻는 방법

5) 딕셔너리
딕셔너리 : key와 value를 한 쌍으로 저장함

6) bool

7) if문

8) for문

9) 함수

파이썬 스크립트 파일 사용 : 파이썬 프로그램을 파일로 저장하고 그 파일을 실행하는 방법


파이썬에선 클래스를 정의할 수 있음 개발자가 직접 클래스를 정의하면 독자적인 자료형을 만들 수 있음
__init__ (=생성자): 클래스를 초기화하는 방법을 정의함 클래스의 인스턴스가 만들어질 때 한 번만 불림
self : 자신의 인스턴스를 나타냄



넘파이 : 배열이나 행렬 계산에 많이 사용되는 라이브러리
import를 해서 numpy 라이브러리를 불러옴

numpy 산술 연산 => 사칙 연산 다 가능

원소 수가 다르면 오류가 발생함
numpy array와 scalar값의 조합으로 된 산술 연산도 수행 가능
=> scalar값이 원소별로 한번씩 계산 수행 = 브로드캐스트

브로드캐스트 => 2x2형태의 배열과 1x2형태의 배열도 연산이 이루어질 수 있음

np.array는 인덱스를 사용해 원소로 접근 가능함

flatten() : n차원 배열을 1차원 배열로 평탄화시킴
X > 15 : X의 배열 중 값이 15 이상인 값만 True로 한 bool배열을 보여줌
X[X>15] : 15보다 큰 값만을 보여줌
matplotlib : 그래프를 그려주는 라이브러리 => 데이터 시각화가 쉬워짐
pyplot : 그래프를 그리려면 matplotlib의 pyplot 모듈을 사용해야 함


추가 기능
plt.xlabel : x축 이름
plt.ylabel : y축 이름
plt.title : 제목
plt.plot(x, y, linestyle="--" , label = "선의 이름")
plt.legend() : 범례
이미지 표시하기
from matplotlib.image import imread
img = imread('이미지.png')
plt.imshow(img)