KPOP IDOL 데이터 시각화
1.excel,csv 데이터 불러오기
import pandas as pd
import os
os.chdir('C:/Users/ADMIN/')
kpop = pd.read_excel('C:/Users/ADMIN/kpop_idol.xlsx')
kpop_b = pd.read_csv('C:/Users/ADMIN/kpop_idols_boy_groups.csv')
kpop_g = pd.read_csv('C:/Users/ADMIN/kpop_idols_girl_groups.csv')
#데이터 합치기
boy.columns, girl.columns
data = pd.concat([boy, girl])
data.shape #(299, 9)
s.columns
data.columns
s = pd.merge(kpop, data, left_on='Group', right_on='Name')
s.shape #(841, 22)
2.데이터 검색과 통계
#데이터 검색
s.head()
s.tail()
s.shape #(841, 22)
s.index
s.columns
s.dtypes
s.ndim
s.size
s.values
s.info()
s.count() #841
#데이터 통계
a = s.describe()
s.mean()
s.median()
s.sum()
s.min()
s.max()
s.var()
s.std()
3.결측치 시각화
#결측치 검색
tab = s.isna().sum() #열별 널값의 갯수
plt.figure(figsize=(15,20)) #그래프 사이즈 조정
sns.barplot(x=tab, y=tab.index)#막대그래프
sns.heatmap(s.isna()) #전체 널값의 위치를 시각화