Seaborn tutorial study 3

김상민·2023년 2월 5일
0

self-directed learning

목록 보기
3/7

Multivariate views on complex datasets 복잡한 데이터 세트에 대한 다변량 시각화

  • 일부 seaborn함수는 데이터 세트의 정보 요약을 빠르게 제공하기 위해 여러 종류의 plot을 조합한다.
    첫번째로 단일관계에 대해 표현하고 두 변수간의 합동 분포를 각 변수 주변 분표에 표시합니다.
penguins = sns.load_dataset("penguins")
sns.jointplot(data=penguins, x="flipper_length_mm", y="bill_length_mm", hue="species")


각각 펭귄에 대한 종과 날개 길이 부리의 길이를 표현 한 것같다.

Gentoo가 대충 날개가 길면 부리도 긴거 같다.

pairplot을 이용해 모든 변수와 관계를 표현해보자

sns.pairplot(data=penguins, hue="species")


뭔가 많이 나왔다. 무게랑 날개길이가 가장 선형회귀 를 따라간다.

Lower-level tools for building figures 대충 시각화를 위한 낮은 레벨의 도구를 뜻하는 것 같다.

g = sns.PairGrid(penguins, hue="species", corner=True)
g.map_lower(sns.kdeplot, hue=None, levels=5, color=".2")
g.map_lower(sns.scatterplot, marker="+")
g.map_diag(sns.histplot, element="step", linewidth=0, kde=True)
g.add_legend(frameon=True)
g.legend.set_bbox_to_anchor((.61, .6))

corner=True 대칭 부분 제거 중복제거라고 생각하자
sns.kdeplot 앞서 했던 커널 밀도 추정이다. 산점도로 표현되었던 펭귄 변수 관계를 곡선화를 해줄 모양이다.

확실히 사용자의 편의를 생각하긴하는것같다.
하나하나 하니까 굉장히 오래걸리네......

profile
꾸준히 하고싶다

0개의 댓글