Matplotlib 시작하기

손문기·2021년 7월 16일
0

Matplotlib?

  • 자료를 차트(chart)나 플롯(plot)으로 시각화하는 패키지다.

Matplotlib 패키지는 plt라는 별칭으로 임포트하여 사용하는것이 관례이다.

import matplotlib as plt

주피터 노트북을 사용하는 경우에는 다음 코드를 통해 노트북 내부에 그림을 표시하도록 해야한다.

%matplotlib inline

그래프 스타일 지정 함수

  • .figsize() : 크기를 지정한다
    .titile() : 제목을 표시한다.
    .xlabel(), .ylabel() : 라벨을 표시한다.
    .xticks(), .yticks() : 눈금을 설정한다.
    .legend() : 범례를 표기한다.

꺾은선 그래프 (Plot)

  • 꺾은선 그래프는 데이터가 어떻게 변화하는지 보여주기 위해 대부분 사용한다.
  • .plot()

산점도 (Scatter Plot)

  • 산점도는 데이터를 흩뿌려 놓은듯한 모습으로 각 데이터를 점 하나로 표시한다.
  • 산점도를 통해 변수간의 관계 흐름을 유추할수도 있다.
    -.scatter()

박스 그림 (Box Plot)

  • 수치형 데이터에 대한 정보를 나타넨다 (Q1, Q2, Q3, min, max)
  • .boxplot()

막대 그래프 (Bar Plot)

  • 범주형 데이터의 값과 그 값의 크기를 직사각형으로 나타낸다.
  • .bar()

원형그래프 (Pie Chart)

  • 전체에 대한 데이터의 비율을 원형 그래프로 나타낸다.
  • 다른 그래프에 비해서 비율 확인이 용이하다.
  • .pie()

Seaborn

  • Seaborn은 Marplotlib을 기반으로 다양한 기능을 추가한 시각화 패키지이다.
import seaborn as sns

커널 밀도 그림 (Kernel Density Plot)

  • 연속적인 분포를 곡선화해서 그린 그림이다.
  • sns.kdeplot()
  • shade : 그래파 아래 음영을 추가할 수 있다. (default=False)

카운트 그림 (Count Plot)

  • 범주형 컬럼의 빈도수를 시각화한다.
  • groupby 후의 도수를 하는것과 동일한 효과이다.
  • sns.count()

캣 그림 (Cat Plot)

  • 숫자형 변수와 하나 이상의 범주형 변수의 관계를 보여주는 함수이다.
  • sns.catplot()

스트립 그림 (Strip Plot)

  • scatter plot과 유사하게 데이터의 수치를 표현한다.
  • sns.stripplot()

swarm plot

  • sns.swarmplot() 은 stripplot과 비슷하지만 데이터를 나타내는 점이 겹치지 않도록 옆으로 퍼져서 보여준다.

히트맵 (Heatmap)

  • 데이터의 행렬을 색상으로 표현한다.
  • sns.heatmap()

0개의 댓글