Q : 공분산과 상관계수는 무엇일까요? 수식과 함께 표현해주세요
공분산을 통해 확률변수 X, Y 사이의 선형관계에 대한 정보를 알 수 있다.
Cov(X, Y) > 0 양의 선형관계 : X가 증가 할 때 Y도 증가한다.
Cov(X, Y) < 0 음의 선형관계 : X가 증가 할 때 Y는 감소한다.
Cov(X, Y) = 0 두 변수 간 선형관계가 없다. X와 Y가 독립이라면 공분산은 0이지만 역은 성립하지 않는다.
확률변수 X의 평균(기대값), Y의 평균(기대값)이 다음과 같을 때,
공분산 수식은 아래와 같다.
두 확률변수의 scale에 따라 공분산의 크기가 달라지므로, 공분산의 크기가 상관의 정도를 나타내진 않는다.
반면 상관계수는 공분산을 각 변수의 표준편차로 나누어 단위화함으로써 상관 정도의 절대적인 크기를 측정할 수 있다.
1에 가까울수록 양의 선형관계를 가진다.
-1에 가까울수록 음의 선형관계를 가진다.
0이면 두 변수 간 상관관계가 없다.
면접 질문 출처
https://github.com/zzsza/Datascience-Interview-Questions