데이터 타입 이슈를 해결한 후, 데이터를 pivot_table을 활용하여 요약하고 구조화할 수 있습니다. 이를 통해 분석에 적합한 형태로 데이터를 정리할 수 있습니다.
Pandas의 pivot_table은 데이터를 요약하고, 특정 기준에 따라 집계 결과를 테이블 형식으로 변환합니다.
먼저 데이터프레임의 컬럼을 확인하여 피벗 테이블 생성에 필요한 컬럼을 파악합니다:
python
코드 복사
result.columns
여러 컬럼을 index로 설정하여 데이터를 요약합니다:
python
코드 복사
result.pivot_table(
index=['상품군별(1)', '상품군별(2)', '운영형태별(1)'], # 행 기준
columns='날짜', # 열 기준
aggfunc='sum' # 집계 함수
)
index: 데이터를 그룹화할 기준. 여기서는 상품군별(1), 상품군별(2), 운영형태별(1)을 사용.columns: 데이터를 열로 구분하는 기준.aggfunc: 집계 방식. 여기서는 합계를 계산하기 위해 'sum'을 사용.단일 컬럼을 기준으로 데이터를 요약합니다:
python
코드 복사
result.pivot_table(
index=['상품군별(1)'], # 행 기준
aggfunc='sum' # 집계 함수
)
상품군별(1)만 기준으로 데이터를 그룹화하고 나머지 데이터를 합계로 요약합니다.다음은 피벗 테이블을 통해 생성된 결과의 예시입니다:
| 상품군별(1) | 상품군별(2) | 운영형태별(1) | 2023-01 | 2023-02 | 2023-03 |
|---|---|---|---|---|---|
| 식품 | 일반식품 | 온라인 전용몰 | 5000 | 5200 | 5400 |
| 식품 | 건강식품 | 온오프 복합몰 | 2000 | 2500 | 2700 |
| 상품군별(1) | 거래액 합계 |
|---|---|
| 식품 | 15800 |
| 의류 | 12000 |