파이썬 시각화 기초

Ek_5.4·2020년 7월 27일
0
post-thumbnail
  1. matplotlib과 seaborn을 활용한 시각화
    import numpy as np
     import pandas as pd 			# 수치 계산에 사용하는 라이브러리
     %precision 3 				# 표시 자리수 지정
     from matplotlib import pyplot as plt 	# 그래프를 그리기 위한 라이브러리
     %matplotlib inline 			# 그래프를 주피터 노트북 상에 표시
  2. 데이터 생성
    	x = np.array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])
     	y = np.array([2, 3, 4, 3, 5, 4, 6, 7, 4, 8])
  1. matlotlib 꺾은선 그래프
    plt.plot(x, y)
     plt.title("Inlineplot matplotlib")
     plt.xlabel("X")
     plt.ylabel("Y")

  1. seaborn 꺾은선 그래프
    import seaborn as sns
     sns.set()
     plt.plot(x, y, color = 'blue')
     plt.title("Inlineplot seaborn")
     plt.xlabel("X")
     plt.ylabel("Y")

  1. 히스토그램
  • 데이터 생성
    data = np.array([2, 3, 3, 4, 4, 4, 4, 5, 5, 6]) # 데이터 생성
  • 시각화 코드
    sns.distplot(data, bins = 5, color = 'blue', kde = False)

  • 커널밀도추정(kde 부분 제거)
    sns.distplot(data, color = 'blue')

  1. 박스플롯
    : 예시 데이터 활용
    fish_multi = pd.read_excel("C:\\Users\\KIM EUNKI\\fish_multi.xlsx")
     sns.boxplot(data = fish_multi, x = 'species', y = 'length', color = 'gold')

  1. 바이올린플롯
    sns.violinplot(data = fish_multi, x = 'species', y = 'length', color = 'silver')

  1. 막대 그래프
    sns.barplot(data = fish_multi, x = 'species', y = 'length', color = 'red')

  1. 산포도
    : 예시 데이터 활용
    cov_data = pd.read_excel("C:\\Users\\KIM EUNKI\\cov_data.xlsx")
     sns.jointplot(data = cov_data, x = 'x', y = 'y', color = 'gray')

  1. 페어플롯
    : seaborn에 내장되어 있는 붓꽃 데이터 활용
    iris = sns.load_dataset("iris")
     iris.head(3)

  • species별 집계하여 평균
    iris.groupby('species').mean()

  • 페어플롯 시각화
    sns.pairplot(iris, hue = 'species') # hue = '카테고리의 변수 이름'

profile
Data analysis beginner

0개의 댓글