matplotlib, seaborn 기본 문법
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
plt.figure(figsize=(가로길이, 세로길이)) #그래프 크기 설정
sns.000plot(data=데이터, x=X축 컬럼, y=Y축 컬럼, hue=범례 컬럼) #seaborn으로 그래프 그리기
plt.title(제목) #제목 설정
plt.xlabel(라벨) #x축 라벨 설정
plt.ylabel(라벨) #y축 라벨 설정
plt.legend(loc=범례 위치 설정)
plt.xticks(rotation=x축 각도 설정)
plt.yticks(rotation=y축 각도 설정)
plt.show() #그래프 출력
sns.set_style(스타일)
sns.set_palette(팔레트)
sns.set_style('darkgrid')
sns.barplot(data=df, x='species', y='body_mass_g')
plt.show()
sns.set_palette('Set3')
sns.barplot(data=df, x='species', y='body_mass_g')
plt.show()
sns.scatterplot(data=데이터, x= , y= , hue=색)
sns.lmplot(data=데이터, x= , y= , hue=색) # 산점도에 회귀선 추가
sns.scatterplot(data=penguins, x='bill_length_mm', y='bill_depth_mm', style='sex', hue='island')
# style인자를 추가해 스타일 변경가능
plt.show()
# sns.relplot: 한 그래프에서 구분짓고 싶을 때 사용 col을 이용해 구분기준 선정, kind: 그래프의 종류
sns.relplot(data=penguins, x='bill_length_mm', y='bill_depth_mm', hue='sex', col='island', kind='scatter')
plt.show()
# sns.lmpolt: 산점도에 회귀선 추가한
sns.lmplot(data=penguins, x='bill_length_mm', y='bill_depth_mm')
plt.show()
sns.displot(data=데이터, x= , y= , hue=색) # 히스토그램
sns.displot(data=데이터, x= , y= , hue=색, kind='kde') # 밀도 분포
sns.boxplot(data=데이터, x= , y= , hue=색) # 상자 그림
sns.pairplot(data=데이터, hue=색) # 여러 컬럼들간의 분포
sns.displot(data=penguins, x='flipper_length_mm', kde=True)
plt.show()
kde=True 경우
kde='kde' 일 경우 밀도 함수만 보여준다
sns.boxplot(data=penguins, x='body_mass_g', y='species', hue='sex')
plt.show()
pairplot을 이용해 여러 컬럼들 간의 관계를 파악
sns.pairplot(data=penguins, hue='species')
plt.show()
sns.countplot(data=데이터, x=X축 컬럼, hue=색) #X축의 범주별로 행의 개수를 카운트하여 시각화
sns.barplot(data=데이터, y=Y축 컬럼, hue=색) #막대그래프
sns.countplot(data=titanic, x='class', hue='alive')
plt.show()
sns.lineplot(data=데이터, x= , y= , hue=색)
sns.lineplot(data=flights, x="year", y="passengers", hue='month')
plt.show()
sns.heatmap(data=데이터, annot=값 표시 여부, fmt=값 포맷, cmap=컬러맵)
sns.heatmap(data=titanic_pivot, annot=True, fmt='.2f', cmap='Purples')
plt.show()