공분산 vs. 상관계수

yoonene·2022년 8월 19일
0

면접대비

목록 보기
9/17

Q : 공분산과 상관계수는 무엇일까요? 수식과 함께 표현해주세요


공분산 (Covariance)

공분산을 통해 확률변수 X, Y 사이의 선형관계에 대한 정보를 알 수 있다.

Cov(X, Y) > 0 양의 선형관계 : X가 증가 할 때 Y도 증가한다.

Cov(X, Y) < 0 음의 선형관계 : X가 증가 할 때 Y는 감소한다.

Cov(X, Y) = 0 두 변수 간 선형관계가 없다. X와 Y가 독립이라면 공분산은 0이지만 역은 성립하지 않는다.

확률변수 X의 평균(기대값), Y의 평균(기대값)이 다음과 같을 때,

공분산 수식은 아래와 같다.

두 확률변수의 scale에 따라 공분산의 크기가 달라지므로, 공분산의 크기가 상관의 정도를 나타내진 않는다.

상관계수

반면 상관계수는 공분산을 각 변수의 표준편차로 나누어 단위화함으로써 상관 정도의 절대적인 크기를 측정할 수 있다.

1에 가까울수록 양의 선형관계를 가진다.

-1에 가까울수록 음의 선형관계를 가진다.

0이면 두 변수 간 상관관계가 없다.

참조 : https://destrudo.tistory.com/15

면접 질문 출처
https://github.com/zzsza/Datascience-Interview-Questions

profile
NLP Researcher / Information Retrieval / Search

0개의 댓글