영어로 인과관계 = causation , 상관관계 = correlation
무더위와 아이스크림 판매량 증가는 인과관계다.
무더위와 피부가 타는 것은 인과관계다.
위처럼 인과관계는 직접적인 연관이 있는 관계를 뜻한다.
반면, 아이스크림 판매량 증가와 피부가 타는 것은 직접적인 연관이 없다.
그러나 무더위라는 공통분모로 인하여 간접적으로 연관이 생긴다.
이러한 관계를 상관관계라고 칭한다.
파이썬 코드로 구현하면 아래와 같다.
import numpy as np
import matplotlib.pyplot as plt
x = wti['WTI']
y = gas_station.groupby('기간')['휘발유'].mean()
# 상관관계 계산
corr = np.corrcoef(x, y)[0, 1]
# 시각화
plt.scatter(x, y)
plt.title("Title")
plt.xlabel("X Label")
plt.ylabel("Y Label")
plt.show()
print("상관계수: ", corr)
wti 유가와 전국 휘발유 평균가의 상관계수를 파악하는 코드다.
분석 대상에 따라서 x,y 값을 변경하면 된다.
관계가 없을수록 0, 있을수록 1에 가깝도록 설정했다.
상관계수가 양수이면 두 변수간 정비례의 형상을 띄고
음수이면 반비례의 형상을 띈다.
wti와 휘발유는 큰 관계가 없는 것으로 파악됐다 ... 🤔