
상관관계는 인과관계를 의미하지 않음
즉 한 변수가 다른 변수의 변화를 직접적으로 일으키는 것을 증명하지 않음
상관관계 구하기
주어진 데이터에서 상관관계를 구하고, quality와의 상관관계가 가장 큰 값과, 가장 작은 값을 구한 다음 더하시오!
단, quality와 quality 상관관계 제외, 소수점 둘째 자리까지 반올림하여 계산
- 데이터셋 : ../input/red-wine-quality-cortez-et-al-2009/winequality-red.csv
- 오른쪽 상단 copy&edit 클릭 -> 예상문제 풀이 시작
- 스크립트 방식 권장: File -> Editor Type -> Script
import pandas as pd
import numpy as np
# 데이터 불러오기
df = pd.read_csv("../input/red-wine-quality-cortez-et-al-2009/winequality-red.csv")
print(df.head())
out:

#quality와 quality 상관관계를 제외한 quality와의 상관관계
df_corr = df.corr()
df_corr = df_corr[:-1]
print(df_corr['quality'])
out:

# 상관관계의 절댓값
abs_corr = abs(df_corr['quality'])
print(abs_corr)
out:

#상관관계의 최댓값 최솟값
max_corr = abs_corr.max()
min_corr = abs_corr.min()
print(max_corr)
print(min_corr)
out:

#덧셈 후 소수점 두자리까지 반올림 계산
ans = round(max_corr + min_corr,2)
print(ans)
out:

출처: