import pandas as pd
titanic = pd.read_table('파일경로',sep=',')
# 1.Null(공백) 데이터 파악하기
print(titanic.isnull().sum())
# 2. 공백 데이터 제거하기
titanic = titanic.dropna()
corr=titanic.corr(method='pearson')
#결과 확인
corr

생존률x생존률의 상관관계를 확인할 필요가 없기 때문에
corr = corr[corr.Survived !=1]

import matplotlib.pyplot as plt
# 그래프 그리기
corr.plot()

모든 데이터의 상관계수가 그려진 모습
각 요소와 생존률에 대한 관계만 필요하기 때문에 이어서 추가로 작성 필요
# Survived 만 그래프 그리기
corr['Survived'].plot()
# 필요없는 행 삭제(passengerid)
corr = corr.drop(['PassengerId'], axis ='rows')
corr['Survived'].plot()

corr['Survived'].plot.bar()

성별(Sex), 좌석등급(Pclass), 요금(Fare) 순으로 생존과 관련해서 가장 상관관계가 있음을 확인할 수 있었다.