[data science]seaborn-상관관계 시각화

덴장·2026년 4월 18일

data

목록 보기
24/55

# 산점도

  • 어떤겂이 변함에따라 다른값도 변함이 있어 두 값이 상관 관계가 있는 경우
  • 상관관계를 구체적인 수치로 표현 -> 상관계수 , -1에서 1사이 ,
  • 상관관계 0이면 두 값은 상관관계가 없다
  • 0 < 상관계수. 어떤값이 커질 때 같이 커짐. 양의 상관관계
  • 0 > 상관계수. 어떤값이 작아질때 같이 작아짐. 음의 상관관계
  • 상관관계의 강도

    0에 가까울수록 연관 관계가 약해짐

  • scatterplot

sbn.set_theme(rc={'figure.figsize': (6, 6)}, style='white')
sbn.scatterplot(data=df , x='temperature', y='total')

  • regplot
sbn.regplot(data=df , x='temperature', y='total')

  • 음의 상관관계
sbn.regplot(data=df , x='windspeed', y='total')

df.corr(numeric_only=True)

  • total 값과 상관관계에 있는 값을 알고싶은 경우
df.corr(numeric_only=True)['total'].sort_values(ascending=True)
#여기서 .sort_values 부분은 정렬옵션

  • heatmap
sbn.set_theme(rc={'figure.figsize': (10, 8)}, style='white') # 그래프 사이즈 설정
sbn.heatmap(df.corr(numeric_only=True), annot=True) # 상관계수 값 표시


그냥 DataFrame을 넘기는 게 아니라, 상관계수로 이루어진 DataFrame이 필요. 그러려면 insurance_df.corr()와 같이 .corr() 메서드를 사용해서 상관계수 행렬을 먼저 계산.
결과에 변수 이름 사이의 정확한 상관계수 숫자가 보이게 하려면, annot=True 옵션을 추가.

profile
개발자

0개의 댓글