Day25 - Python데이터분석(8). 22.09.29.목

류소리·2022년 9월 28일
0

데이터분석

목록 보기
7/11

< 멀티인덱스(Multi Index)와 관련된 메서드 >

  • 하위분류반환 (xs)
  • 피벗화, 열의 인덱스화 (stack)
  • 언피벗화, 행의 열로 변환 (unstack)
  • 인덱스 순서변경 (swaplevel)
  • 인덱스 제거 (droplevel)

[ 인덱스 순서변경 (swaplevel) ] p311

swaplevel메서드는 Multi Index (또는 Munti Columns)에서
: 두 인덱스의 순서를 변경하는 메서드입니다.

df..swaplevel(i=- 2, j=- 1, axis=0)
i , j : 순서를 변경할 두 인덱스의 레벨입니다.
기본적으로 제일 낮은 두 레벨의 인덱스가 교환됩니다.(-2, -1)

axis : 기본값은 0으로
axis=1로 변경할 경우 Multi Columns에 대해 메서드가 수행됩니다.


[ 데이터 중복 제거 (drop_duplicates()) ] p277

데이터 분석을 하다보면 특정 컬럼의 중복값을 제거해야 할 때가 있는데, pandas의 duplicates, drop_duplicates 메소드를 사용할 수 있다.

  • duplicates( [ 'column' ], keep='first | last | False' ) : [ 'column' ] 에 대해서 중복이 있는지 확인

  • drop_duplicates( ['column'] , keep='first | last | False') : [ 'column' ] 중복값 처리


[ matplotlib 구성] p349

  • matplotlib에서 그래프는 Figure 객체 내에 존재합니다.
In [22]: import matplotlib.pyplot as plt

In [23]: fig = plt.figure()

In [24]: type(fig)
Out[24]: matplotlib.figure.Figure
  • 비어있는 Figure 객체가 화면에 출력됩니다.
  • matplotlib로 그래프를 그리려면 Figure 객체와 하나 이상의 subplot(Axes) 객체가 필요합니다.

  • 빈 Figure 객체에 Axes 객체(또는 subplot)를 생성하려면 add_subplot 메서드를 사용하면 됩니다.
In [35]: fig = plt.figure()

In [36]: ax = fig.add_subplot(1, 1, 1)
# 1x1크기, 4개의 서브프롯 중에서 첫번째

In [37]: type(ax)
Out[37]: matplotlib.axes._subplots.AxesSubplot

In [38]: plt.show()


[ 데이터 재구조화 (pd.crosstab()) ] p371

  • 데이터 재구조화(reshape)
  • pd.crosstab(index, columns) 사용해 교차표(cross tabulation)

분석을 하다 보면 원본 데이터의 구조가 분석 기법에 맞지 않아서 행과 열의 위치를 바꾼다거나, 특정 요인에 따라 집계를 해서 구조를 바꿔주어야 하는 경우가 있습니다.

  • (1) pivot(), pd.pivot_table()
  • (2) stack(), unstack()
  • (3) melt()
  • (4) wide_to_long()
  • (5) pd.crosstab() 


[ 캣 플롯 (catplot) ] p381

: 범주형 변수와 수(치)형 변수간 관계 시각화

import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

출처:
https://wikidocs.net/158420 -> 인덱스 순서변경 (swaplevel)
https://pydole.tistory.com/entry/Python-pandas-%EC%A4%91%EB%B3%B5%EA%B0%92-%EC%B2%98%EB%A6%AC-duplicates-dropduplicates -> drop_duplicates
https://rfriend.tistory.com/280 [R, Python 분석과 프로그래밍의 친구 (by R Friend):티스토리] -> pd.crosstab()
https://wikidocs.net/4763-> Figure 객체에 AxesSubplot 객체
https://codetorial.net/matplotlib/axis_range.html -> Matplotlib정리
https://datascienceschool.net/01%20python/05.04%20%EC%8B%9C%EB%B3%B8%EC%9D%84%20%EC%82%AC%EC%9A%A9%ED%95%9C%20%EB%8D%B0%EC%9D%B4%ED%84%B0%20%EB%B6%84%ED%8F%AC%20%EC%8B%9C%EA%B0%81%ED%99%94.html -> seaborn 정리
https://suuntree.tistory.com/271 -> catplot 외 판다스 정리

profile
새싹 빅테이터 개발자

0개의 댓글