pivot_table, iterrows(), module

jun hyeon·2023년 9월 1일

pivot_table

데이터 셋의 데이터를 보다 구조화되고 소화하기 쉬운 형식으로 재구성하고 요약하는 방법.

  • 데이터 셋의 합계, 평균 등을 요약한다.
  • 특정 기준에 따라 데이터를 그룹화, 범주화 한다.
  • 데이터를 여러 계층으로 구성할 수 있다.

줄 수 있는 인자는 index, columns, values, aggfunc 등이 있다.

인덱스를 'Name'컬럼으로 설정

다중 인덱스 설정도 가능

value 값 'Price'로 설정

aggfunc를 'sum'으로 주어 'Price'를 합산하여 적용, 출력.

2개이상의 인덱스, value를 설정도 가능.

iterrows()

  • Pandas 데이터 프레임은 대부분 2차원,
  • 이럴 때 for 문을 사용하면, n번째라는 지정을 반복해서 가독률이 떨어짐. 그래서 쓰는 것이 iterrows()
  • 인덱스와 값으로 받아 반복함.

'crime_station' 데이터 셋 확인.

인덱스와 rows를 받아 반복. index만 일단 먼저 출력해봄.

인덱스인 '구분' 컬럼의 값들이 반복해서 출력.
그 인덱스의 rows까지 출력.

각 인덱스의 rows까지 출력.

module 설치

pip 명령

  • python의 공식 모듈

  • !pip list

  • !pip install module_name

  • !pip uninstall module_name

모듈 삭제시 사용.

0개의 댓글