데이터 그 자체만으로부터 인사이트를 얻어내는 접근법! ← 시각화
df.dtypes
데이터에 대한 요약을 제공해준다.
df.describe()
df.corr()
sum(), count()을 붙여줘 합을 확인할 수 있다.
df.isnull()
조건에 대한 개수에 대해 알 수 있다.
df['조건'].value_counts()
sns.countplot
를 이용해서 titanic 데이타의 생존자 수와 사망자 수를 막대그래프로 표현하였다.sns.heatmap()
를 통해서 좌석 등급별로 생존률을 시각화 하였다.titanic_df[['Pclass','Survived']].groupby(['Pclass']).mean()
를 통해서 2개의 기준에 대해서 groupby
를 해주었다.sns.catplot()
을 이용하여 성별에 따른 생존자 수를 비교하였다.catplot
를 이용하여 survived가 0과 1일때를 잘 나타내주었다.-sns.kdeplot()
를 이용하여 나이에 따른 생존자수와, 사망자 수를 시각화 하였다.