11. 데이터 재구조화 4 - 데이터타입 이슈 해결 (2)

Ryan·2025년 1월 9일

SQL/Python 분석

목록 보기

15/94

11. 데이터 재구조화 4 - 데이터타입 이슈 해결 (2)

피벗 테이블을 사용하여 데이터 요약

데이터 타입 이슈를 해결한 후, 데이터를 pivot_table을 활용하여 요약하고 구조화할 수 있습니다. 이를 통해 분석에 적합한 형태로 데이터를 정리할 수 있습니다.

1. 피벗 테이블 기본 구조

Pandas의 pivot_table은 데이터를 요약하고, 특정 기준에 따라 집계 결과를 테이블 형식으로 변환합니다.

2. 컬럼 확인

먼저 데이터프레임의 컬럼을 확인하여 피벗 테이블 생성에 필요한 컬럼을 파악합니다:

python
코드 복사
result.columns

출력 결과: 데이터프레임의 컬럼명을 반환합니다.
이 정보를 기반으로 피벗 테이블의 index와 columns를 설정합니다.

3. 다중 기준 피벗 테이블

여러 컬럼을 index로 설정하여 데이터를 요약합니다:

python
코드 복사
result.pivot_table(
    index=['상품군별(1)', '상품군별(2)', '운영형태별(1)'],  # 행 기준
    columns='날짜',                                        # 열 기준
    aggfunc='sum'                                          # 집계 함수
)

index: 데이터를 그룹화할 기준. 여기서는 상품군별(1), 상품군별(2), 운영형태별(1)을 사용.
columns: 데이터를 열로 구분하는 기준.
aggfunc: 집계 방식. 여기서는 합계를 계산하기 위해 'sum'을 사용.

4. 단일 기준 피벗 테이블

단일 컬럼을 기준으로 데이터를 요약합니다:

python
코드 복사
result.pivot_table(
    index=['상품군별(1)'],  # 행 기준
    aggfunc='sum'          # 집계 함수
)

이 경우, 상품군별(1)만 기준으로 데이터를 그룹화하고 나머지 데이터를 합계로 요약합니다.

5. 결과 예시

다음은 피벗 테이블을 통해 생성된 결과의 예시입니다:

다중 기준 피벗 테이블

상품군별(1)	상품군별(2)	운영형태별(1)	2023-01	2023-02	2023-03
식품	일반식품	온라인 전용몰	5000	5200	5400
식품	건강식품	온오프 복합몰	2000	2500	2700

단일 기준 피벗 테이블

상품군별(1)	거래액 합계
식품	15800
의류	12000

요약

다중 기준 피벗 테이블: 세부적으로 데이터를 요약하고 비교하는 데 유용.
단일 기준 피벗 테이블: 단순한 분석과 요약에 적합.

Ryan

이전 포스트

10. 데이터 재구조화 3 - 데이터타입 이슈 해결 (1)

다음 포스트