[Boostcamp AI Tech] Data Viz 4강

이성범·2022년 2월 5일
0

Boostcamp AI Tech

목록 보기
20/49

통계와 차트

이번 강에서는 Python seaborn 라이브러리에서 제공하는 다양한 그래프에 대하여 학습을 진행했다.

00. 학습 내용

  • Seaborn에서 제공하는 다양한 그래프에 대하여 학습

01. Seaborn

  • Seaborn은 Python에서 사용하는 Matplotlib 기반 통계 시각화 라이브러리이다.

  • countplot 함수를 활용하여 위와 같이 범주형 변수를 세주는 막대 그래프로 나타낼 수 있다.

  • boxplot 함수를 활용하여 위와 같이 데이터의 분포를 4분위수를 활용해 확인할 수 있는 Box plot을 그릴 수 있다.

  • violinplot 함수를 활용하여 Box plot에서는 나타내기 어려웠던 실제 분포를 조금더 연속적으로 나타낼 수 있다.

  • histplot 함수를 활용해 히스토그램을, kdeplot 함수를 활용해 Kernel Density Estimate을, ecdfplot 함수를 활용해 누적 밀도 함수를, rugplot을 활용해 선을 사용한 밀도함수 그래프를 그릴 수 있다.

  • scatterplot 함수를 활용해 산점도를, histplot를 이용하여 결합확률분포를 나타내어 산점도에서 더 나아가 데이터를 분포적인 측면에서 더 잘 확인할 수 있는 그래프를 그릴 수 있다.

  • lineplot 함수를 활용해 간단한 선그래프도 나타낼 수 있다.

  • regplot 함수를 활용해 추세선이 포함된 산점도 또한 그릴 수 있다.

  • heatmap 함수를 활용해 상관계수, 행렬 등의 정보를 조금더 시각적으로 표현할 수 있다.

  • jointplot 함수를 활용해 2개 피처의 다양한 결합확률 분포를 시각화할 수 있다.

  • pairplot 함수를 활용해 모든 피쳐들 간의 산점도를 그려 변수간의 관계도 쉽게 확인할 수 있다.
profile
Machine Learning Engineer at Konan Technology

0개의 댓글