Python 상관계수

이정연·2023년 3월 23일
0

Play Data

목록 보기
10/26

인과관계 vs 상관관계

  • 영어로 인과관계 = causation , 상관관계 = correlation

  • 무더위와 아이스크림 판매량 증가는 인과관계다.

  • 무더위와 피부가 타는 것은 인과관계다.

  • 위처럼 인과관계는 직접적인 연관이 있는 관계를 뜻한다.

  • 반면, 아이스크림 판매량 증가와 피부가 타는 것은 직접적인 연관이 없다.

  • 그러나 무더위라는 공통분모로 인하여 간접적으로 연관이 생긴다.

  • 이러한 관계를 상관관계라고 칭한다.

상관계수

  • 이러한 상관관계를 수치화 한 것이 상관계수다.

파이썬 코드로 구현하면 아래와 같다.

import numpy as np
import matplotlib.pyplot as plt
x = wti['WTI']
y = gas_station.groupby('기간')['휘발유'].mean()
# 상관관계 계산
corr = np.corrcoef(x, y)[0, 1]

# 시각화
plt.scatter(x, y)
plt.title("Title")
plt.xlabel("X Label")
plt.ylabel("Y Label")
plt.show()

print("상관계수: ", corr)

wti 유가와 전국 휘발유 평균가의 상관계수를 파악하는 코드다.

분석 대상에 따라서 x,y 값을 변경하면 된다.

관계가 없을수록 0, 있을수록 1에 가깝도록 설정했다.

상관계수가 양수이면 두 변수간 정비례의 형상을 띄고
음수이면 반비례의 형상을 띈다.

wti와 휘발유는 큰 관계가 없는 것으로 파악됐다 ... 🤔

출처

https://brunch.co.kr/@strongfe28/45

profile
0x68656C6C6F21

0개의 댓글