범주형 변수의 산점도를 표현하는 다양한 방법을 알아봅니다.
서브플룻을 그리는 catplot알아보기
scatterplot
stripplot
swarmplot
catplot
kind: bar, point, box, violin, strip, swarm
범주형 변수의 산점도를 scatterplot으로 표현하면 같은 곳에 점이 여러 개 찍혀서 값을 제대로 표현하기 어렵기에 범주형 데이터의 산점도를 표현할 때는 stripplot 을 사용하면 점을 흩어지게 그리게 됩니다. 하지만 이 그래프 역시 데이터가 많으면 점이 겹쳐 보이게 되는데 이 단점을 보완한 시각화가 swarmplot 입니다.
*scatterplot
# scatterplot 으로 범주형 변수 그리기
sns.scatterplot(data=df, x="origin", y="mpg")
*stripplot
# stripplot
sns.stripplot(data=df, x="origin", y="mpg")
*swarmplot
# swarmplot
plt.figure(figsize=(10,4))
sns.swarmplot(data=df, x="origin", y="mpg", size=3)
*catplot
catplot 은 범주형 데이터의 서브플롯을 그릴 때 사용하고 기본 값은 stripplot이며 아래 catplot 을 통해 kind 값을 지정해 bar, point, box, violin, strip, swarmplot을 시각화 할 수 있습니다.
code
# catplot
sns.catplot(data= df, x = "origin", y="mpg")
# catplot 으로 boxplot그리기
# catplot
sns.catplot(data= df, x = "origin", y="mpg", col= "cylinders", col_wrap = 3, kind="box")
# catplot 으로 violinplot그리기
# catplot
sns.catplot(data= df, x = "origin", y="mpg", col= "cylinders", col_wrap = 3, kind="violin")
# catplot 으로 countplot그리기
# catplot
sns.catplot(data= df, x = "origin", col= "cylinders", col_wrap = 3, kind="count")
# catplot 으로 boxplot그리기
# df 전체를 넣고 시각화 하기
sns.catplot(data= df, kind="box", aspect=3)
# catplot 으로 violinplot그리기
# df 전체를 넣고 시각화 하기
sns.catplot(data= df, kind="violin", aspect=3)