pivot_table
- 그룹화
- 행 인덱스
- 열 인덱스
- 데이터의 값
- 데이터의 집계 (ex/ min max mean sum)
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
titanic = sns.load_dataset('titanic')[['age','sex','class','fare','survived']]
pv1 = pd.pivot_table(titanic, #기준이되는 데이터프레임
index = 'class', # 등급별로 그룹회
columns= 'sex', # 성별로 분할
values = 'age', # 그룹화된 데이터들의 나이를 선택
aggfunc = 'mean') # 나이의 평균
pv1
## 등글별 + 성별 생존자의 수
titanic.groupby(["class","sex"])["survived"].sum()
pv2 = pd.pivot_table(titanic,index = 'class',columns='sex',values='survived',aggfunc='sum')
pv2
## 자리등급과 성별에 따라서 (index)
# 생존자와 사망자의 (column)
# 나이의 평균
pv3 = pd.pivot_table(titanic,index = ['class','sex'],columns='survived',values='age',aggfunc='mean')
pv3
pv3.plot.barh()
pv3.xs('male',level='sex') ## 성별이 male인 데이터만 추출