판다스

모서아·2024년 12월 24일

파이썬 복습공책

목록 보기
5/5

group by()

  • 데이터를 피봇팅하여 통계량을 볼 수 있도록 도와주는 메서드
  • 특정 조건에 맞게 전처리해 줄 때 용이

by : 그룹화할 내용. 함수, 축, 리스트 등등이 올 수 있음
sort : 그룹키를 정렬할지 여부
dropna : 결측값을 계산에서 제외할지 여부

# 다중 컬럼 groupby
df.groupby(['sex', 'pclass'])[['survived', 'age']].mean()

# 다중 통계값
df.groupby(['sex', 'pclass'])[['survived', 'age']].agg(['mean', 'sum'])

pivot_table()

  • 데이터를 스프레드시트 기반 피벗 테이블로 변환하는 메서드, 엑셀 스프레드시트 피벗 테이블과 유사

values : 값으로 입력될 컬럼
aggfunc : 적용할 함수
fill_value : 결측치를 채워넣을 값

# index에 그룹을 표기
df.pivot_table(index='who', values='survived')

# columns에 그룹을 표기
df.pivot_table(columns='who', values='survived')

df.pivot_table(index=['who', 'pclass'], values='survived')
df.pivot_table(index='who', 
							columns='pclass', 
							values='survived', 
							aggfunc=['sum', 'mean'])

0개의 댓글