seaborn에서 distplot 함수를 사용하여 히스토그램을 만들 수 있다.
(seaborn을 sns로 불러오고)
sns.distplot(데이터프레임이름["변수이름"])
sns.distplot(데이터프레임이름["변수이름"], bins=n) -> n개의 막대가 생성
선 없이 막대그래프만 출력하려면
sns.distplot(a=데이터프레임이름["변수이름"], hist=True, kde=False, rug=False)
(선 없이 막대 그래프만)
Rug와 커널 밀도 함께 출력하기
: Rug란 그래프의 X 축에 데이터를 1차원으로 표시해준다는 의미이다.
: 그래프 하단에 커널의 밀도를 표시해주는 그래프도 추가해서 출력해보자.
sns.distplot(a=데이터프레임이름["변수이름"], hist=True, kde=True, rug=True)
Rug 상세하게 조정해서 출력하기(Rug 파라미터 상세하게 조정하기)
sns.distplot(a=데이터프레임이름["변수이름"], rug=True,
rug_kws={"color":"r", "alpha":0.3, "linewidth":2, "height":0.2})
밀도 조정해서 출력하기
sns.distplot(a=데이터프레임이름["변수이름"], kde=True,
rug_kws={"color":"g", "alpha":0.3, "linewidth":5, "shade":True})
(kde: 커널(k) 밀도(density의 de))
세로축으로 출력하기
sns.distplot(데이터프레임이름["변수이름"], color="skyblue", vertical=True)
한 그래프 안에 변수 2개 이상 출력하기
import matplotlib.pyplot as plt
f, axes = plt.subplots(2, 2, figsize=(7,7), sharex=True) -> 칸을 2x2로 나눔
sns.distplot(데이터프레임이름["sepal_length"], color="skyblue", ax=axes[0,0]) # (0,0)에 위치
sns.distplot(데이터프레임이름["sepal_width"], color="olive", ax=axes[0,1]) # (0,1)에 위치
sns.distplot(데이터프레임이름["petal_length"], color="gold", ax=axes[1,0]) # (1,0)에 위치
sns.distplot(데이터프레임이름["petal_width"], color="teal", ax=axes[1,1]) # (1,1)에 위치
출처
https://m.blog.naver.com/PostView.naver?isHttpsRedirect=true&blogId=youji4ever&logNo=221804922659