import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
- drinks.csv 파일 로드
- 'beer_serving', 'sprit_serving', 'wine_serving', 'total_litres_of_pure_alcohol' 컬럼 데이터 간의 상관관계 출력
- 행렬 히트맵 시각화
- 국가별 술 소비량 대비 알콜 비율 컬럼 추가
- 국가별 순위 시각화 하여 출력
drinks = pd.read_csv("../csv/drinks.csv")
drinks.head(1)
## 상관계수 행렬 생성
corr = drinks[
['beer_servings',
'spirit_servings',
'wine_servings',
'total_litres_of_pure_alcohol']].corr(method='pearson')
corr
## 시각화
cols_view = ['beer', 'spirit', 'wine', 'alcohol']
sns.set(font_scale=1.5)
hm = sns.heatmap(
corr.values,
cbar = True,
annot = True,
square = True,
fmt = '.2f',
annot_kws= {'size' : 20},
xticklabels= cols_view,
yticklabels= cols_view
)
plt.tight_layout()
plt.show()
## pairs
sns.set(style='whitegrid', context='notebook')
sns.pairplot(drinks[
['beer_servings',
'spirit_servings',
'wine_servings',
'total_litres_of_pure_alcohol']
], height=2.5)
plt.show()