(DataStructure & Algorithm) PivotTable

임경민·2023년 10월 10일
1
post-thumbnail

🔑Summarization


  • 피벗테이블(PivotTable)

📗Contents


  • DataLoad

  • 인덱스 설정
    • Name을 인덱스로 Data 재설정
# Name을 기준으로 인덱스로 두고 Data 재정렬
pd.pivot_table(df, index = ['Name'], values=['Account', 'Quantity', 'Price']) # 피벗 테이블

  • 인덱스(Index)는 여러개 설정 가능
# 인덱스는 여러개 설정 가능
pd.pivot_table(df, index = ['Name', 'Rep' ,'Manager'], values=['Account', 'Quantity', 'Price'])

pd.pivot_table(df, index = ['Rep' ,'Manager'], values=['Account', 'Quantity', 'Price'])

Option

  • 중복된 데이터 정리를 위한 Option으로, 기본 Option은 평균(Mean)으로 지정됨
pd.pivot_table(df, index = ['Rep' ,'Manager'], values=['Price']) # 중복된 데이터 정리 기본 옵션 : 평균

  • 평균(Mean), 합계(Sum), 길이(Length) 등 다양한 Option 설정 가능
pd.pivot_table(df, index = ['Rep' ,'Manager'], values=['Price'], aggfunc = "sum") # 중복된 데이터 정리 옵션 설정 가능 : mean, sum, length 등

  • numpy module을 통해서도 설정 가능
pd.pivot_table(df, index = ['Rep' ,'Manager'], values=['Price'], columns= ['Product'], aggfunc = [np.sum], fill_value = 0) # 중복된 데이터 정리 옵션 설정 가능 : mean, sum, length 등

  • 여러개의 Option을 표현 가능
pd.pivot_table(df, index = ['Manager', 'Rep' ,'Product'], 
               values=['Price', 'Quantity'], 
               aggfunc = [np.sum, np.mean], 
               fill_value = 0, 
               margins = True) # 중복된 데이터 정리 옵션 설정 가능 : mean, sum, length 등

0개의 댓글