판다스 groupby

skyepodium·2020년 8월 11일
0

1. 자료형

groupby를 적용하면 자료형이 변한다.

DataFrame -> DataFrameGroupBy
Series -> SeriesGroupBy

data.groupby('age')

2. GroupBy 자료형

GroupBy 결과는 기존 DataFrame, Series 처럼 사용할 수 없다.
sum, mean 등의 집계함수를 적용해야한다.

GroupBy 결과에 집계함수를 적용하면 자료형이 변한다.

DataFrameGroupBy -> DataFrame
SeriesGroupBy -> Series

data.groupby('age').mean()

3. sort_values

데이터를 정렬한다.

DataFrame, Series에 적용가능

  • asecending: 오름차순 여부
  • by: 정렬 기준 (데이터프레임에만 적용가능)
data.groupby('age').mean().sort_values('fare')

4. 집계함수

1) 모든 칼럼에 적용

데이터프레임에 집계함수를 적용하면 모든 칼럼에 동일한 집계함수가 적용된다.

data.mean()

2) 개별 칼럼에 적용

선택한 칼럼에만 집계함수가 적용된다.

data.agg({
'age': 'mean', 'fare': 'median'
})
profile
callmeskye

0개의 댓글