1.데이터 가져오기, 기본정보 알아보기
2. pivot_table 이용
여러개의 인덱스를 사용하는 경우, 숫자값은 평균값으로 계산되어 나오고 카테고리가 여러개인 문자열 데이터의 컬럼은 같은 이름 내에서 몇가지 카테고리 별로 컬럼값들이 정리된다.
인덱스 지정시, 그에 맞는 숫자형태의 데이터 값이 컬럼으로 분류되고 이때 기본적으로 평균값으로 출력된다. valuse에 컬럼을 지정해주면, 특정 컬럼에 관해서만 분류된다.
기본적으로 숫자형태의 값은 평균값으로 계산되는데 aggfunc=[np.sum] 인자를 이용해 [] 안에 넘파이 제공 함수를 사용하여 합 등 원하는값으로 계산할 수 있다.
index , values , columns 값 모두 여러개 가능하고 [] 리스트 안에 작성해야한다. NaN 값이 있으면 후에 데이터프레임 전체 계산에서 object 데이터 형태에서 에러가 날 수 있으므로 fill_values 인자를 통해 원하는 값으로 채울 수 있다.