[Python] pivot table, groupby, get_group, agg 사용하기

도도요닝·2022년 8월 14일

python

목록 보기

1/12

pivot_table 사용하기

pd.pivot_table(df, index='행 인덱스', columns = '열 인덱스' , values = '조회하고 싶은 값', aggfunc='집계 방식')

aggfunc : 'mean' 'sum' 'count'

groupby 사용하기 [그룹통계]

df.groupby('그룹').count()
df.groupby('그룹').mean()
df.groupby('그룹').var() #분산
df.groupby('그룹').std() #표준편차
df.groupby('그룹').min()
df.groupby('그룹').max()
df.groupby('그룹').sum()

df.groupby('그룹명')['추출하고자 하는 컬럼명']
**#그룹은 index로 위치**

#여러 개 그룹을 지정하고 싶다면 
#index가 늘어남
df.groupby(['그룹명','그룹명2'])

인덱스 분할 reset_index()

df.groupby(['그룹명','그룹명2']).reset_index() 
#두 개로 나뉘어있던 인덱스가 다시 '컬럼'으로 돌아감

get_group()

#DataFrame의 index가 나타남
df.groupby('그룹명').groups

df.groupby('그룹명').get_group('묶고자 하는 값')

agg()

df.groupby('그룹명').agg({'컬럼명1':'sum','컬럼명2':'mean'})

index로 '그룹명' 생기고 컬럼1에 대한 합계, 컬럼2에 대한 평균으로 컬럼 생성됨

도도요닝

다음 포스트

[Python] pivot table, groupby, get_group, agg 사용하기

python

pivot_table 사용하기

groupby 사용하기 [그룹통계]

인덱스 분할 reset_index()

get_group()

agg()

[Python] [pandas] Join, Merge, Contact : 데이터 합치기

0개의 댓글