공분산 행렬(Covariance Matrix)
공분산 글에서 알 수 있듯이, 공분산은 두 확률변수 X,Y 사이의 상관관계를 보여주는 척도이다. 이 때, X가 여러 변수의 관측값으로 주어진 데이터셋, 즉, 각각의 벡터 변수 x1,x2,⋯,xn에 대해 X=(x1,x2,⋯,xn)T이라고 할 때, X의 각각의 특징 값들의 분포가 서로 얼마만큼 닮아있는지를 나타내는 행렬이 바로 공분산 행렬이다.
공분산 행렬 KXX은 다음과 같이 정의된다.
KXX≡E[(X−E[X])(X−E[X])T]=⎣⎢⎢⎢⎢⎡Cov(x1,x1)Cov(x2,x1)⋮Cov(xn,x1)Cov(x1,x2)Cov(x2,x2)⋮Cov(xn,x2)⋯⋯⋱⋯Cov(x1,xn)Cov(x2,xn)⋮Cov(xn,xn)⎦⎥⎥⎥⎥⎤
또한, Y=(y1,y2,⋯,yn)T에 대해 X와 Y 사이의 교차 공분산을 생각할 수도 있는데, 이 때 두 확률변수 사이의 교차 공분산 행렬(Cross-Covariance Matrix)는 다음과 같다.
KXY≡E[(X−E[X])(Y−E[Y])T]=⎣⎢⎢⎢⎢⎡Cov(x1,y1)Cov(x2,y1)⋮Cov(xn,y1)Cov(x1,y2)Cov(x2,y2)⋮Cov(xn,y2)⋯⋯⋱⋯Cov(x1,yn)Cov(x2,yn)⋮Cov(xn,yn)⎦⎥⎥⎥⎥⎤
공분산 행렬 KXX는 Σ 또는 Var(X) 등으로도 표기되고, 교차 공분산 행렬 KXY는 Cov(X,Y) 등으로도 표기된다.
공분산 행렬의 성질
공분산 행렬은 다음과 같은 성질을 만족한다.
- KXX=E(XXT)−μXμXT,μX=E[X].
- KXX는 양의 준정부호(positive-semidefinite) 행렬이다. 즉, aKXXaT≥0∀ a∈Rn.
- KXX는 대칭행렬이다. 즉, - KXX는 대칭행렬이다. 즉, KXX = KXXT.
- 임의의 m×n 상수 행렬 A, m×1 상수 벡터 a에 대해, Var(AX+a)=AVar(X)AT
- 같은 차원의 확률 벡터 X,Y에 대해, Var(X+Y)=Var(X)+Var(Y)+Cov(X,Y)+Cov(Y,X)