Seaborn은 Matplotlib을 기반으로 다양한 색상 테마와 통계용 차트 등의 기능을 추가한 시각화 패키지입니다.
기본적인 시각화 기능은 Matplotlib 패키지에 의존하며 통계 기능은 Statsmodels 패키지에 의존합니다.
✍️ 입력
import seaborn as sns
개수 또는 빈도
구간(이산)분포
누적 확률 및 백분위수 추정
중위수, 사분위간 범위
변수 간 관계
연속된 데이터
countplot()을 사용하면 각 카테고리 값마다의 데이터가 얼마나 있는지 표시할 수 있습니다.
타이타닉호의 데이터셋을 활용해서 카운트 플롯을 확인해보겠습니다.
x키워드 인수
에 Series
를 전달하고 있습니다. ✍️ 입력
df = sns.load_dataset('titanic')
sns.countplot(x=df['class'])
📜 출력
hue키워드 인수
를 활용하여 분류할 두번째 변수
를 설정할 수 있습니다.✍️ 입력
sns.countplot(data=df, x='class', hue='alive')
📜 출력
수평
하게도 작성할 수 있습니다.✍️ 입력
sns.countplot(data=df, y='deck', hue='alive')
📜 출력
러그(rug) 플롯은 데이터 위치를 x축 위에 작은 선분(rug)으로 나타내어 실제 데이터들의 위치를 보여준다.
tips의 데이터셋을 활용해서 러스 플롯을 확인해보겠습니다.
✍️ 입력
tips = sns.load_dataset('tips')
sns.kdeplot(data=tips, x='total_bill')
sns.rugplot(data=tips, x='total_bill')
📜 출력
✍️ 입력
sns.scatterplot(data=tips, x='total_bill', y='tip')
sns.rugplot(data=tips, x='total_bill', y='tip')
📜 출력