06. Pivot 실습
| 배운 것 | 설명 |
|---|---|
pivot(index = , columns = , values = ) | 데이터의 열을 기준으로 피벗테이블로 변환시키는 메서드 |
drop() | 데이터프레임에서 행/열을 삭제하는 메서드 |
pivot_table(index = , columns = , values = ) | 데이터를 스프레드시트 기반 피벗 테이블로 변환하는 메서드 |
df.pivot(index=None, columns=None, values=None)
index : 인덱스로 사용될 열
columns : 열로 사용될 열
values : 값으로 입력될 열
※ index나 columns에 리스트를 입력 할 경우 멀티 인덱스로 피벗테이블이 생성 / values에 리스트를 입력 할 경우 각 값에 대한 테이블이 연속적으로 생성
df.drop(labels=None, axis=0, index=None, columns=None, level=None,
inplace=False, errors='raise')
labels : 삭제할 레이블명 / axis를 지정해야함
axis : {0 : index / 1 : columns} labels인수를 사용할 경우 지정할 축
index : 인덱스명을 입력해서 바로 삭제 가능
columns : 컬럼명을 입력해서 바로 삭제 가능
level : 멀티인덱스의 경우 레벨을 지정해서 진행 가능
inplace : 원본을 변경할지 여부/ True일 경우 원본이 변경
errors : 삭제할 레이블을 찾지 못할경우 오류를 띄울지 여부 / ignore할 경우 존재하는 레이블만 삭제
※ axis=0 + labels 는 index인수와 역할이 같고 axis=1 + labels는 columns와 역할이 같음
df.pivot_table(values=None, index=None, columns=None, aggfunc='mean', fill_value=None,
margins=False, dropna=True, margins_name='All', observed=False, sort=True)
values : 값으로 입력될 열
index : 인덱스로 사용될 열
columns : 열로 사용될 열
aggfunc : 결과로 출력될 함수
fill_value : 결측치를 채워 넣을 값
margins : 합계를 표시할지 여부 / True일 경우 새 열을 생성하여 합계를 출력
dropna : 항목이 모두 결측치인 열을 포함할지 여부 / 기본값은 True로 포함하지 않는다
margins_name : margins가 True일 경우 해당 열의 이름
observed : 범주형 그룹에 대해 관찰된 값만 표시할지 여부
sort : 각 범주들을 사전적으로 정리할지 여부 / 기본값은 True로 정렬이 수행