[Python] Seaborn 패키지 - countplot(), rugplot()

김민수·2023년 1월 31일
0

Python 정리

목록 보기
2/5
post-thumbnail

📌 개념

✅ Seaborn이란

Seaborn은 Matplotlib을 기반으로 다양한 색상 테마와 통계용 차트 등의 기능을 추가한 시각화 패키지입니다.

기본적인 시각화 기능은 Matplotlib 패키지에 의존하며 통계 기능은 Statsmodels 패키지에 의존합니다.

✍️ 입력

import seaborn as sns
  1. 개수 또는 빈도

    • 막대 그래프 : barplot()
    • 누적 막대 그래프 : countplot()
  2. 구간(이산)분포

    • 히스토그램 : histplot(), displot()
  3. 누적 확률 및 백분위수 추정

    • 누적 분포함수 : displot()
  4. 중위수, 사분위간 범위

    • Box plot : boxplot()
    • Violin plot : violinplot(), catplot()
  5. 변수 간 관계

    • Two variable : scatterplot(), stripplot()
    • Categorical : swarmplot(), catplot(), heatmap(), pairplot()
  6. 연속된 데이터

    • 선형 그래프 : plot()

✅ 카운트 플롯

countplot()을 사용하면 각 카테고리 값마다의 데이터가 얼마나 있는지 표시할 수 있습니다.
countplot

타이타닉호의 데이터셋을 활용해서 카운트 플롯을 확인해보겠습니다.

  1. x키워드 인수Series를 전달하고 있습니다.

✍️ 입력

df = sns.load_dataset('titanic')
sns.countplot(x=df['class'])

📜 출력
countplot2

  1. hue키워드 인수를 활용하여 분류할 두번째 변수를 설정할 수 있습니다.

✍️ 입력

sns.countplot(data=df, x='class', hue='alive')

📜 출력
countplot3

  1. 플롯을 수평하게도 작성할 수 있습니다.

✍️ 입력

sns.countplot(data=df, y='deck', hue='alive')

📜 출력
countplot4


✅ 러그 플롯

러그(rug) 플롯은 데이터 위치를 x축 위에 작은 선분(rug)으로 나타내어 실제 데이터들의 위치를 보여준다.

rugplot

tips의 데이터셋을 활용해서 러스 플롯을 확인해보겠습니다.

  1. 러그 플롯과 커널 밀도

✍️ 입력

tips = sns.load_dataset('tips')
sns.kdeplot(data=tips, x='total_bill')
sns.rugplot(data=tips, x='total_bill')

📜 출력
rugplot2

  1. 러그플롯과 스캐터플롯

✍️ 입력

sns.scatterplot(data=tips, x='total_bill', y='tip')
sns.rugplot(data=tips, x='total_bill', y='tip')

📜 출력
rugplot3

0개의 댓글

관련 채용 정보