범주형과 수치형 변수로 막대그래프를 시각화 합니다.
barplot
groupby
pivot_table
범주형과 수치형 변수로 막대그래프를 시각화할 때, barplot 은 범주형 변수와 수치형 변수의 대표값을 그릴 때 사용합니다.
수치형 변수를 표현하는 대표값에 대한 기본값은 평균입니다.
barplot의 값을 직접 구하고자 한다면 groupby와 pivot_table을 통해 구할 수 있습니다.
*범주형 VS 수치형
# barplot 으로 origin 별 mpg 값 구하기
sns.barplot(data=df, x="origin", y="mpg", estimator=np.mean, ci=None)
*groupby통한 연산
# groupby를 통해 origin 별로 그룹화 하고 mpg 의 평균 구하기
df.groupby("origin")["mpg"].mean()
*pivot table를 통한 연산
# pivot_table 로 같은 값 구하기
pd.pivot_table(data=df, index="origin", values="mpg")
# pivot_table 를 통해 위 시각화에 대한 값을 구하기
pd.pivot_table(data=df, index="cylinders",columns="origin", values="mpg")
*barplot으로 다양하게 구현
# barplot 으로 합계 값 구하기
sns.barplot(data=df, x="origin", y="mpg", estimator=np.sum,ci=None)
# barplot 에 hue 를 사용하여 색상을 다르게 표현해 보기
sns.barplot(data=df, x="cylinders",y="mpg", ci=None, hue="origin")
# cylinders 와 mpg 의 x, hue 값을 변경해서 시각화
sns.barplot(data=df, x="origin",y="mpg", hue="cylinders",ci=None)