공분산 행렬

NK590·2023년 10월 3일
0

공분산 행렬(Covariance Matrix)

공분산 글에서 알 수 있듯이, 공분산은 두 확률변수 X,YX, Y 사이의 상관관계를 보여주는 척도이다. 이 때, XX가 여러 변수의 관측값으로 주어진 데이터셋, 즉, 각각의 벡터 변수 x1,x2,,xnx_1, x_2, \cdots, x_n에 대해 X=(x1,x2,,xn)T\mathbf{X} = (x_1, x_2, \cdots, x_n)^T이라고 할 때, X\mathbf{X}의 각각의 특징 값들의 분포가 서로 얼마만큼 닮아있는지를 나타내는 행렬이 바로 공분산 행렬이다.

공분산 행렬 KXXK_{XX}은 다음과 같이 정의된다.

KXXE[(XE[X])(XE[X])T]=[Cov(x1,x1)Cov(x1,x2)Cov(x1,xn)Cov(x2,x1)Cov(x2,x2)Cov(x2,xn)Cov(xn,x1)Cov(xn,x2)Cov(xn,xn)]K_{\mathbf{X}\mathbf{X}} \equiv E[(\mathbf{X} - E[\mathbf{X}])(\mathbf{X} - E[\mathbf{X}])^T] = \begin{bmatrix} Cov(x_1, x_1) & Cov(x_1, x_2) & \cdots & Cov(x_1, x_n) \\ Cov(x_2, x_1) & Cov(x_2, x_2) & \cdots & Cov(x_2, x_n) \\ \vdots & \vdots & \ddots & \vdots \\ Cov(x_n, x_1) & Cov(x_n, x_2) & \cdots & Cov(x_n, x_n) \end{bmatrix}

또한, Y=(y1,y2,,yn)T\mathbf{Y} = (y_1, y_2, \cdots, y_n)^T에 대해 X\mathbf{X}Y\mathbf{Y} 사이의 교차 공분산을 생각할 수도 있는데, 이 때 두 확률변수 사이의 교차 공분산 행렬(Cross-Covariance Matrix)는 다음과 같다.

KXYE[(XE[X])(YE[Y])T]=[Cov(x1,y1)Cov(x1,y2)Cov(x1,yn)Cov(x2,y1)Cov(x2,y2)Cov(x2,yn)Cov(xn,y1)Cov(xn,y2)Cov(xn,yn)]K_{\mathbf{X}\mathbf{Y}} \equiv E[(\mathbf{X} - E[\mathbf{X}])(\mathbf{Y} - E[\mathbf{Y}])^T] = \begin{bmatrix} Cov(x_1, y_1) & Cov(x_1, y_2) & \cdots & Cov(x_1, y_n) \\ Cov(x_2, y_1) & Cov(x_2, y_2) & \cdots & Cov(x_2, y_n) \\ \vdots & \vdots & \ddots & \vdots \\ Cov(x_n, y_1) & Cov(x_n, y_2) & \cdots & Cov(x_n, y_n) \end{bmatrix}

공분산 행렬 KXXK_{\mathbf{X}\mathbf{X}}Σ\Sigma 또는 Var(X)Var(\mathbf{X}) 등으로도 표기되고, 교차 공분산 행렬 KXYK_{\mathbf{X}\mathbf{Y}}Cov(X,Y)Cov(\mathbf{X}, \mathbf{Y}) 등으로도 표기된다.


공분산 행렬의 성질

공분산 행렬은 다음과 같은 성질을 만족한다.

  • KXX=E(XXT)μXμXT,μX=E[X]K_{\mathbf{X}\mathbf{X}} = E(\mathbf{X}\mathbf{X}^T) - \mu_{\mathbf{X}}\mu_{\mathbf{X}}{}^T,\quad \mu_{\mathbf{X}} = E[\mathbf{X}].
  • KXXK_{\mathbf{X}\mathbf{X}}는 양의 준정부호(positive-semidefinite) 행렬이다. 즉, aKXXaT0 aRn\mathbf{a}K_{\mathbf{X}\mathbf{X}}\mathbf{a}^T \geq 0 \quad \forall\ \mathbf{a}\in\mathbb{R}^n.
  • KXXK_{\mathbf{X}\mathbf{X}}는 대칭행렬이다. 즉, - KXXK_{\mathbf{X}\mathbf{X}}는 대칭행렬이다. 즉, KXXK_{\mathbf{X}\mathbf{X}} = KXXTK_{\mathbf{X}\mathbf{X}}{}^T.
  • 임의의 m×nm \times n 상수 행렬 A\mathbf{A}, m×1m \times 1 상수 벡터 a\mathbf{a}에 대해, Var(AX+a)=AVar(X)ATVar(\mathbf{A}\mathbf{X} + \mathbf{a}) = \mathbf{A}Var(\mathbf{X})\mathbf{A}^T
  • 같은 차원의 확률 벡터 X,Y\mathbf{X}, \mathbf{Y}에 대해, Var(X+Y)=Var(X)+Var(Y)+Cov(X,Y)+Cov(Y,X)Var(\mathbf{X} + \mathbf{Y}) = Var(\mathbf{X}) + Var(\mathbf{Y}) + Cov(\mathbf{X}, \mathbf{Y}) + Cov(\mathbf{Y}, \mathbf{X})
profile
AI 엔지니어 (진)

0개의 댓글