파이썬 기초_10

jh_k·2023년 2월 5일
0

python기초

목록 보기
10/11

pivot_table

  1. 그룹화
  2. 행 인덱스
  3. 열 인덱스
  4. 데이터의 값
  5. 데이터의 집계 (ex/ min max mean sum)
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt


titanic = sns.load_dataset('titanic')[['age','sex','class','fare','survived']]
pv1 = pd.pivot_table(titanic, #기준이되는 데이터프레임
                    index = 'class', #  등급별로 그룹회
                    columns= 'sex',   # 성별로 분할
                    values = 'age',  # 그룹화된 데이터들의 나이를 선택
                    aggfunc = 'mean') # 나이의 평균
pv1
## 등글별 + 성별  생존자의 수
titanic.groupby(["class","sex"])["survived"].sum()
pv2 = pd.pivot_table(titanic,index = 'class',columns='sex',values='survived',aggfunc='sum')
pv2
## 자리등급과 성별에 따라서 (index)
# 생존자와 사망자의 (column)
# 나이의 평균
pv3 = pd.pivot_table(titanic,index = ['class','sex'],columns='survived',values='age',aggfunc='mean')
pv3
pv3.plot.barh()
pv3.xs('male',level='sex')   ## 성별이 male인 데이터만 추출
profile
Just Enjoy Yourself

0개의 댓글