파이썬 시각화 기초

ek1816·2020년 7월 27일
0
post-thumbnail
  1. matplotlib과 seaborn을 활용한 시각화

import numpy as np
import pandas as pd # 수치 계산에 사용하는 라이브러리
%precision 3 # 표시 자리수 지정
from matplotlib import pyplot as plt # 그래프를 그리기 위한 라이브러리
%matplotlib inline # 그래프를 주피터 노트북 상에 표시
2. 데이터 생성

x = np.array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])
y = np.array([2, 3, 4, 3, 5, 4, 6, 7, 4, 8])
  1. matlotlib 꺾은선 그래프

plt.plot(x, y)
plt.title("Inlineplot matplotlib")
plt.xlabel("X")
plt.ylabel("Y")

  1. seaborn 꺾은선 그래프

import seaborn as sns
sns.set()
plt.plot(x, y, color = 'blue')
plt.title("Inlineplot seaborn")
plt.xlabel("X")
plt.ylabel("Y")

  1. 히스토그램
  • 데이터 생성

data = np.array([2, 3, 3, 4, 4, 4, 4, 5, 5, 6]) # 데이터 생성

  • 시각화 코드

sns.distplot(data, bins = 5, color = 'blue', kde = False)

  • 커널밀도추정(kde 부분 제거)

sns.distplot(data, color = 'blue')

  1. 박스플롯
    : 예시 데이터 활용

fish_multi = pd.read_excel("C:\Users\KIM EUNKI\fish_multi.xlsx")
sns.boxplot(data = fish_multi, x = 'species', y = 'length', color = 'gold')

  1. 바이올린플롯

sns.violinplot(data = fish_multi, x = 'species', y = 'length', color = 'silver')

  1. 막대 그래프

sns.barplot(data = fish_multi, x = 'species', y = 'length', color = 'red')

  1. 산포도
    : 예시 데이터 활용

cov_data = pd.read_excel("C:\Users\KIM EUNKI\cov_data.xlsx")
sns.jointplot(data = cov_data, x = 'x', y = 'y', color = 'gray')

  1. 페어플롯
    : seaborn에 내장되어 있는 붓꽃 데이터 활용

iris = sns.load_dataset("iris")
iris.head(3)

  • species별 집계하여 평균

iris.groupby('species').mean()

  • 페어플롯 시각화

sns.pairplot(iris, hue = 'species') # hue = '카테고리의 변수 이름'

profile
Data analysis beginner

0개의 댓글