[TIL Day15] Python으로 시각화하기 - Matplotlib

이다혜·2021년 5월 6일
1

TIL

목록 보기
16/60

Python으로 시각화하기 - Matplotlib

1. Matplotlib 시작하기

  • 파이썬의 데이터 시각화 라이브러리
  • %matplotlib inline을 통해서 활성화
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

%matplotlib inline

2. 자주 사용되는 Plotting의 Options

  • plt.plot(): 꺾은선 그래프를 그리는 함수

  • plt.figure(): plotting을 할 도면을 선언

  • figsize: figure()의 인자로 도면(그래프) 크기 조절

2차함수 그리기 with plot()


  • plt.xlabel(), plt.ylabel(): x, y축에 설명 추가하기

  • plt.axis(): x, y축의 범위 설정하기

  • plt.xticks(), plt.yticks(): x, y축에 눈금 설정하기

  • plt.title(): 그래프에 title 달기

  • plt.legend(): 범례 설정하기

3. Matplotlib Case Study

꺾은선 그래프(Plot)

  • plt.plot()
  • 시계열 데이터에 많이 사용

산점도(Scatter Plot)

  • plt.scatter()
  • x와 y사이의 상관관계를 파악하는 데 사용

상자 그림(Box Plot)

  • plt.boxplot()
  • 수치형 데이터에 대한 정보(Q1, Q2, Q3, min, max)

막대 그래프(Bar Plot)

  • plt.bar()
  • 범주형 데이터의 "값"과 그 값의 크기를 직사각형으로 나타낸 그림

원형 그래프(Pie Chart)

  • plt.pie()
  • 데이터에서 전체에 대한 부분의 비율을 부채꼴로 나타낸 그래프
  • 다른 그래프에 비해서 비율 확인에 용이

4. Seaborn Case Study

Matplotlib를 기반으로 더 다양한 시각화 방법을 사용하는 라이브러리

커널밀도그림(Kernel Density Plot)

  • 히스토그램과 같은 연속적인 분포를 곡선화해서 그린 그림
  • sns.kdeplot()

카운트그림(Count Plot)

  • 범주형 column의 빈도수를 시작화 -> Groupby 후의 도수를 하는 것과 동일한 효과
  • sns.countplot()

캣그림(Cat Plot)

  • 숫자형 변수와 하나 이상의 범주형 변수의 관계를 보여주는 함수
  • sns.catplot()

스트립그림(Strip Plot)

  • scatter plot과 유사하게 데이터의 수치를 표현하는 그래프
  • sns.stripplot()

히트맵(Heatmap)

  • 데이터의 행렬을 색상으로 표현해주는 그래프
  • 상관계수 그래프를 그리는 데 주로 사용
  • sns.heatmap()
profile
하루하루 성장중

0개의 댓글