[TIL] Day 13 - matplotlib & seaborn

기역의궁전·2021년 5월 6일
0

dev2_TIL

목록 보기
14/18

I. Matplotlib 시작하기

  • 파이썬의 데이터 시각화 라이브러리
  • %mmatplotlib inline을 통해 주피터 노트북에서 활성화
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

%matplotlib inline

cf) range(a,b,c) vs np.arange(a,b,c)

# np.arange(a,b,c) # a ~ b-c까지 c간격으로 -> [a,b)
# cf) range(a,b,c) # a ~ b-c까지 c간격으로 단 c가 무조건 int -> [a,b)

print(np.arange(1,10,0.5))
print(list(range(1,10,1)))

#[1.  1.5 2.  2.5 3.  3.5 4.  4.5 5.  5.5 6.  6.5 7.  7.5 8.  8.5 9.  9.5]
#[1, 2, 3, 4, 5, 6, 7, 8, 9]

꺾은선 그래프 (Plot)

  • plt.plot()
  • 시계열 그래프에 사용됨 (시간의 지남에 따라 결과값)

산점도 (Scatter Plot)

  • plt.scatter()
  • x,y가 완전히 별개의 변수일때 상관관계 및 분포

박스 그림 (Box Plot)

  • plt.boxplot()
  • 단일 수치형 데이터에 대한 축약된 정보 (Q1,Q2,Q3, min, max)
    (Q1~3 : 사분위수, Q2 = median)

막대 그래프 (Bar Plot)

  • plt.bar(x,hight=)
  • 범주형 데이터의 값과 그 값의 크기를 직사각형으로 나타낸 그림
  • 빈도(도수)를 나타낼 때 주로 사용

cf. 히스토그램 (histogram)

  • plt.hist()
  • 도수분포를 직사각형에 막대형태로 나타낸 그림
  • "계급(bins)"이라는 분류로 나타냄 즉 범주형 데이터로 구성 후 그림을 그림
  • 값끼리 붙어 있다.

원형 그래프 (Pie Chart)

  • plt.pie()
  • 데이터에서 전체에 대한 부분의 비율을 부채꼴로 나타낸 그래프
  • 다른 그래프에서 비해서 비율 확인에 용이

IV. The 멋진 그래프, Seaborn Case Study

Matplotlib를 기반으로 더 다양한 시각화 방법을 제공하는 라이브러리

Seaborn Import 하기

import seaborn as sns

커널밀도그림 (Kernel Density Plot)

  • sns.kdeplot()
  • 히스토그램과 같은 연속적인 분포를 곡선화해서 그린그림

카운트 그림(Count Plot)

  • sns.countplot()
  • 범주형 column의 빈도수를 시각화 \rightarrow Groupby 후의 도수를 측정하는 것과 동일

캣그림 (Cat Plot)

  • sns.catplot(x=,y=,data=,kind='strip')
  • 숫자형 변수와 하나 이상의 범주형 변수의 관계를 보여주는 함수

스트립그림 (Strip Plot)

  • sns.stripplot(x=,y=,data=)
  • scatter plot과 유사하게 데이터의 수치를 표현하는 그래프

히트맵 (Heatmap)

  • sns.heatmap()
  • 데이터의 행렬을 색상으로 표현해주는 그래프
  • 가장 많이 사용하는 경우, 상관계수행렬

0개의 댓글