[AIVLE SCHOOL] 데이터 분석 (9) - 이변량 분석4

춤추는 머쉬룸·2024년 9월 30일

AIVLE SCHOOL 6기

목록 보기
31/80
post-thumbnail

9/30 4, 5세션

A. 숫자형 & 범주형

A-1. 시각화

kdeplot()

  • common_norm = True, hue='범주형' : 각각의 면적 비율에 따라 그리기 (잘 안씀)
  • common_norm = False : 생존자, 사망자 각각 그리기 (비율 고려X)
  • multiple = 'fill' : 모든 구간에 대해 100% 비율로 그리기

1번 그래프

  • 생존자와 사망자가 겹치는 곳이 전체 평균
  • 양을 확인
  • 두 변수가 전혀 관련이 없으면 완전 겹쳐서 나옴

2번 그래프

  • 빨간 선이 전체 평균
  • 비율을 확인
sns.kdeplot(x='Age', data = titanic, hue ='Survived'
            , multiple = 'fill')
plt.axhline(titanic['Survived'].mean(), color = 'r')
plt.show()

TIP! Density
가우시안 기법에 의해 계산된 밀도

histplot

  • kdeplot과 비슷하게 사용 가능
  • hue='범주형' : 범주형에 대해 범주 별로 나눠서 그림
  • 구간 별로 확인 가능함
sns.histplot(x='Age', data = titanic, bins = 16
             , hue ='Survived', multiple = 'fill')
plt.axhline(titanic['Survived'].mean(), color = 'r')
plt.show()

0개의 댓글