df.info(verbose=Truem show_counts=True)
df = df[[column1 , column2, column3, ....]]
import smissingno as msno
msno.matrix(df)
plt.show()
fig, ax = plt.subplots(figsize=(15,6))
sns.countplot(palette = ~~~~)
palette로 sns 효과를 낼 수 있다
sns 안에서 order!
- order= 하면 원하는 컬럼으로 정렬 가능!
pie 차트를 깔끔하게
- 공식 문서를 보고 깔끔하게 정리하자!
stacked=True
df.sort_values(by =columns).plot(kind='barh', stacked=True, figsize=(18,10), color=sns.color_palette('RdYlGn',9))
df를 정렬한 후 플랏을 그리고, 들어가는 카테고리가 많기 때문에 stacked = True로 넣어주자
https://matplotlib.org/stable/plot_types/stats/pie.html#sphx-glr-plot-types-stats-pie-py
ax.bar_label(ax.containers[0])
print(ax.containers) # 바 개수
축 : 그래프의 축을 의미
패널 : 뷰안의 막대 변경
원(단위) 표현을 하고 싶다면 ?
- 패널 > 숫자 > 접두사 추가
막대차트
- 범주 데이터 비교
라인 차트
- 시간별 추세 확인날짜 형식
날짜
- 위 > 불연속 , 아래 > 연속
연속형, 불연속형
- 불연속형인 경우 년단위로 끊긴다?
파이차트
- 배열도 정리 가능 색상을 먹인 측정값에 정렬을 누룬다
도넛 차트
- 이중축기능, 두개의 원을 만들어 두고(열 컬럼에) 하나는 원하는 값을 먹여준다. 전체 총 매출정보는 합친 하얀 원에 넣는다
맵 차트
- 시도 차원에서 지리적 역할을 선택한다.
각각 색상 분절 : 별도의 범례 선택
날짜 필터
- 굳이 매개변수가 필요 없다. 필터를 걸어주고 전체 시트에 적용해주면 깔끔하게 된다