11. 데이터 재구조화 4 - 데이터타입 이슈 해결 (2)

Ryan·2025년 1월 9일

SQL/Python 분석

목록 보기
15/94

11. 데이터 재구조화 4 - 데이터타입 이슈 해결 (2)

피벗 테이블을 사용하여 데이터 요약

데이터 타입 이슈를 해결한 후, 데이터를 pivot_table을 활용하여 요약하고 구조화할 수 있습니다. 이를 통해 분석에 적합한 형태로 데이터를 정리할 수 있습니다.


1. 피벗 테이블 기본 구조

Pandas의 pivot_table은 데이터를 요약하고, 특정 기준에 따라 집계 결과를 테이블 형식으로 변환합니다.


2. 컬럼 확인

먼저 데이터프레임의 컬럼을 확인하여 피벗 테이블 생성에 필요한 컬럼을 파악합니다:

python
코드 복사
result.columns
  • 출력 결과: 데이터프레임의 컬럼명을 반환합니다.
  • 이 정보를 기반으로 피벗 테이블의 indexcolumns를 설정합니다.

3. 다중 기준 피벗 테이블

여러 컬럼을 index로 설정하여 데이터를 요약합니다:

python
코드 복사
result.pivot_table(
    index=['상품군별(1)', '상품군별(2)', '운영형태별(1)'],  # 행 기준
    columns='날짜',                                        # 열 기준
    aggfunc='sum'                                          # 집계 함수
)
  • index: 데이터를 그룹화할 기준. 여기서는 상품군별(1), 상품군별(2), 운영형태별(1)을 사용.
  • columns: 데이터를 열로 구분하는 기준.
  • aggfunc: 집계 방식. 여기서는 합계를 계산하기 위해 'sum'을 사용.

4. 단일 기준 피벗 테이블

단일 컬럼을 기준으로 데이터를 요약합니다:

python
코드 복사
result.pivot_table(
    index=['상품군별(1)'],  # 행 기준
    aggfunc='sum'          # 집계 함수
)
  • 이 경우, 상품군별(1)만 기준으로 데이터를 그룹화하고 나머지 데이터를 합계로 요약합니다.

5. 결과 예시

다음은 피벗 테이블을 통해 생성된 결과의 예시입니다:

  • 다중 기준 피벗 테이블
상품군별(1)상품군별(2)운영형태별(1)2023-012023-022023-03
식품일반식품온라인 전용몰500052005400
식품건강식품온오프 복합몰200025002700
  • 단일 기준 피벗 테이블
상품군별(1)거래액 합계
식품15800
의류12000

요약

  • 다중 기준 피벗 테이블: 세부적으로 데이터를 요약하고 비교하는 데 유용.
  • 단일 기준 피벗 테이블: 단순한 분석과 요약에 적합.

0개의 댓글