penguins = sns.load_dataset("penguins")
sns.jointplot(data=penguins, x="flipper_length_mm", y="bill_length_mm", hue="species")
각각 펭귄에 대한 종과 날개 길이 부리의 길이를 표현 한 것같다.
Gentoo가 대충 날개가 길면 부리도 긴거 같다.
pairplot을 이용해 모든 변수와 관계를 표현해보자
sns.pairplot(data=penguins, hue="species")
뭔가 많이 나왔다. 무게랑 날개길이가 가장 선형회귀 를 따라간다.
g = sns.PairGrid(penguins, hue="species", corner=True)
g.map_lower(sns.kdeplot, hue=None, levels=5, color=".2")
g.map_lower(sns.scatterplot, marker="+")
g.map_diag(sns.histplot, element="step", linewidth=0, kde=True)
g.add_legend(frameon=True)
g.legend.set_bbox_to_anchor((.61, .6))
corner=True 대칭 부분 제거 중복제거라고 생각하자
sns.kdeplot 앞서 했던 커널 밀도 추정이다. 산점도로 표현되었던 펭귄 변수 관계를 곡선화를 해줄 모양이다.
확실히 사용자의 편의를 생각하긴하는것같다.
하나하나 하니까 굉장히 오래걸리네......