통계와 차트
이번 강에서는 Python seaborn 라이브러리에서 제공하는 다양한 그래프에 대하여 학습을 진행했다.
00. 학습 내용
- Seaborn에서 제공하는 다양한 그래프에 대하여 학습
01. Seaborn
- Seaborn은 Python에서 사용하는 Matplotlib 기반 통계 시각화 라이브러리이다.
- countplot 함수를 활용하여 위와 같이 범주형 변수를 세주는 막대 그래프로 나타낼 수 있다.
- boxplot 함수를 활용하여 위와 같이 데이터의 분포를 4분위수를 활용해 확인할 수 있는 Box plot을 그릴 수 있다.
- violinplot 함수를 활용하여 Box plot에서는 나타내기 어려웠던 실제 분포를 조금더 연속적으로 나타낼 수 있다.
- histplot 함수를 활용해 히스토그램을, kdeplot 함수를 활용해 Kernel Density Estimate을, ecdfplot 함수를 활용해 누적 밀도 함수를, rugplot을 활용해 선을 사용한 밀도함수 그래프를 그릴 수 있다.
- scatterplot 함수를 활용해 산점도를, histplot를 이용하여 결합확률분포를 나타내어 산점도에서 더 나아가 데이터를 분포적인 측면에서 더 잘 확인할 수 있는 그래프를 그릴 수 있다.
- lineplot 함수를 활용해 간단한 선그래프도 나타낼 수 있다.
- regplot 함수를 활용해 추세선이 포함된 산점도 또한 그릴 수 있다.
- heatmap 함수를 활용해 상관계수, 행렬 등의 정보를 조금더 시각적으로 표현할 수 있다.
- jointplot 함수를 활용해 2개 피처의 다양한 결합확률 분포를 시각화할 수 있다.
- pairplot 함수를 활용해 모든 피쳐들 간의 산점도를 그려 변수간의 관계도 쉽게 확인할 수 있다.