범주형과 수치형 변수를 막대그래프로 시각화하기

매일 공부(ML)·2022년 2월 13일
0

학습 목표

범주형과 수치형 변수로 막대그래프를 시각화 합니다.


핵심 키워드

barplot

groupby

pivot_table


Point

범주형과 수치형 변수로 막대그래프를 시각화할 때, barplot 은 범주형 변수와 수치형 변수의 대표값을 그릴 때 사용합니다.

수치형 변수를 표현하는 대표값에 대한 기본값은 평균입니다.

barplot의 값을 직접 구하고자 한다면 groupby와 pivot_table을 통해 구할 수 있습니다.


Code시각화

*범주형 VS 수치형

# barplot 으로 origin 별 mpg 값 구하기
sns.barplot(data=df, x="origin", y="mpg", estimator=np.mean, ci=None)

*groupby통한 연산

# groupby를 통해 origin 별로 그룹화 하고 mpg 의 평균 구하기
df.groupby("origin")["mpg"].mean()

*pivot table를 통한 연산

# pivot_table 로 같은 값 구하기
pd.pivot_table(data=df, index="origin", values="mpg")

# pivot_table 를 통해 위 시각화에 대한 값을 구하기
pd.pivot_table(data=df, index="cylinders",columns="origin", values="mpg")

*barplot으로 다양하게 구현

# barplot 으로 합계 값 구하기
sns.barplot(data=df, x="origin", y="mpg", estimator=np.sum,ci=None)

# barplot 에 hue 를 사용하여 색상을 다르게 표현해 보기
sns.barplot(data=df, x="cylinders",y="mpg", ci=None, hue="origin")

# cylinders 와 mpg 의 x, hue 값을 변경해서 시각화
sns.barplot(data=df, x="origin",y="mpg", hue="cylinders",ci=None)

profile
성장을 도울 아카이빙 블로그

0개의 댓글