pivot() vs pivot_table()

까만호랭·2023년 11월 5일

📌 pivot()

pivot()은 데이터프레임의 형태를 변환하는 데 사용됩니다.
주로 두 개의 열(피벗 열과 값 열)을 선택하고, 피벗 테이블을 만들기 위해 데이터를 재구성합니다.
pivot() 메서드는 피벗 열과 값 열을 지정하고, 행과 열 인덱스로 사용할 열을 지정합니다.
pivot()은 중복된 인덱스/열 조합이 있을 경우 오류를 발생시킬 수 있습니다.

import pandas as pd

data = {'날짜': ['2023-01-01', '2023-01-01', '2023-01-02', '2023-01-02'],
        '도시': ['서울', '뉴욕', '서울', '뉴욕'],
        '온도': [5, 10, 3, 8]}

df = pd.DataFrame(data)
pivot_table = df.pivot(index='날짜', columns='도시', values='온도')

📌 pivot_table()

pivot_table()은 데이터를 요약하고 집계하는 데 사용됩니다.
데이터를 그룹화하고 집계 함수(기본값은 평균)를 적용하여 결과를 표로 나타냅니다.
pivot_table() 메서드는 열의 데이터를 그룹화하고, 각 그룹에 대해 집계 함수를 계산하여 결과 데이터프레임을 생성합니다.
pivot_table()은 중복된 인덱스/열 조합을 다루기 쉽고, 누락된 데이터를 처리하는 기능을 제공합니다.

📖 정리

pivot()은 데이터 구조를 변경하고 피벗팅할 때 사용되며,
pivot_table()은 데이터를 요약하고 집계할 때 사용됩니다.

까만호랭

남들과 함께 발자국을 남기는 까만호랭

이전 포스트

평균, 분산, 표준편차

다음 포스트

pivot() vs pivot_table()

📌 pivot()

📌 pivot_table()

📖 정리

평균, 분산, 표준편차

ANOVA 분산분석(일원,이원)

0개의 댓글