Seabon turtorial study 2

김상민·2023년 2월 5일
0

self-directed learning

목록 보기
2/7

A high-level API for statistical graphics(통계 그래픽을 위한 고오오오급 API 기능)

  • Seaborn은 일관된 데이터 세트 지향 API를 사용하여 서로 다른 시각적 표현을 쉽게 전환할 수 있다고 합니다.
  • 함수 relplot()은 많은 다른 통계 관계를 시각화하도록 설계되었습니다.
  • 산점도는 종종 효과적이지만 한 변수가 시간의 측도를 나타내는 관계는 선이 더 잘 표현됩니다.
  • relplot() 함수에는 다음 대체 표현으로 쉽게 전환할 수 있는 편리한 종류의 매개 변수가 있습니다
dots = sns.load_dataset("dots")
sns.relplot(
    data=dots, kind="line",
    x="time", y="firing_rate", col="align",
    hue="choice", size="coherence", style="choice",
    facet_kws=dict(sharex=False),  ##마지막 ,를 추가해주고 안해주고에서 차이가 난다.
)

data='load한 dots데이터'
relplot(시각화 함수)
kind="그래프 종류"
hue="범주형 데이터에만 사용가능"
facet_kws=dict(sharex=False), x축 y축을 보기 좋게 범위를 설정해주는 기능

실행 후 이런 그래프가 나왔다.


마지막 ,를 뺀 그래프

Statistical estimation 통계적 추정

fmri = sns.load_dataset("fmri")
sns.relplot(
    data=fmri, kind="line",
    x="timepoint", y="signal", col="region",
    hue="event", style="event",
)


진한 부분은 평균을 옅은 부분은 편차를 말하는 것 같다.

sns.lmplot(data=tips, x="total_bill", y="tip", col="time", hue="smoker")


산점도와 선형회귀를 포함 시킨 그래피 같습니다.

Distributional representations 분포 표현? 묘사? 여튼 나타낸것

sns.displot(data=tips, x="total_bill", col="time", kde=True)


kde=True로 분포도에 따라 곡선을 그려주는 기능이다.

  • 누적분포
sns.displot(data=tips, kind="ecdf", x="total_bill", col="time", hue="smoker", rug=True)


kkind="ecdf"가 누적 분포 이다. rug=True로 x축 쪽에 관측치를 넣어주었다. 바닥에 까는 러그 그거 말하는 건가?

범주형 데이터 표현

sns.catplot(data=tips, kind="swarm", x="day", y="total_bill", hue="smoker")

커널? 밀도 추정을 사용하여 점으로 표현한 그래프를 기본 분포를 알아 낼 수 있다고 한다.
커널 밀도 추정은 히스토그램같은 분포를 부드럽게 곡선화시킨거라고 한다.

sns.catplot(data=tips, kind="violin", x="day", y="total_bill", hue="smoker", split=True)


위 산점도 그래프가 곡선화 되었다.

또는 각 내포된 범주 내에서 평균 값과 신뢰 구간만 표시할 수 있습니다:

sns.catplot(data=tips, kind="bar", x="day", y="total_bill", hue="smoker")

profile
꾸준히 하고싶다

0개의 댓글