데이터 시각화2

김현지·2022년 10월 30일
0
post-thumbnail

KPOP IDOL 데이터 시각화

1.excel,csv 데이터 불러오기

import pandas as pd
import os
os.chdir('C:/Users/ADMIN/')
kpop = pd.read_excel('C:/Users/ADMIN/kpop_idol.xlsx')
kpop_b = pd.read_csv('C:/Users/ADMIN/kpop_idols_boy_groups.csv')
kpop_g = pd.read_csv('C:/Users/ADMIN/kpop_idols_girl_groups.csv')
#데이터 합치기
boy.columns, girl.columns
data = pd.concat([boy, girl])
data.shape #(299, 9)
s.columns
data.columns
s = pd.merge(kpop, data, left_on='Group', right_on='Name')
s.shape #(841, 22)

2.데이터 검색과 통계

#데이터 검색
s.head()
s.tail()
s.shape #(841, 22)
s.index
s.columns
s.dtypes
s.ndim
s.size
s.values
s.info()
s.count() #841

#데이터 통계
a = s.describe()
s.mean()
s.median()
s.sum()
s.min()
s.max()
s.var()
s.std()

3.결측치 시각화

#결측치 검색
tab = s.isna().sum() #열별 널값의 갯수
plt.figure(figsize=(15,20)) #그래프 사이즈 조정
sns.barplot(x=tab, y=tab.index)#막대그래프
sns.heatmap(s.isna()) #전체 널값의 위치를 시각화
profile
안녕하세요! 오늘도 모두 좋은 하루 보내세요!

0개의 댓글