Multivariate normal distribution(다변수 정규 분포)

Junshick Yoon·2022년 8월 13일
0

딥러닝 수학

목록 보기
1/4

일반적인 정규 분포...

일반적으로 정규 분포 하면 많이들 변수가 하나인 정규 분포를 떠올리실 겁니다.

여기서의 변수는 x값 하나로 하나의 변수에 대해서만 분포를 나타내 줍니다. 평균과 분산만 알 수 있다면 분포에 관한 모든 정보를 알 수 있는 가장 중요한 분포도 이기도 합니다.

XN(μ,θ2),μR,σ2<0X\sim N(\mu,\:\theta^2),\:\mu\in\R,\:\sigma^2<0

f(x)=12πσ2e12σ2(xμ)2f(x) = \frac{1}{\sqrt{2\pi\sigma^2}}e^{-\frac{1}{2\sigma^2}(x-\mu)^2}

다변수 정규 분포...

다변수 정규 분포는 일차원의 정규분포를 다차원으로 일반화 시킨것 입니다. 이 분포는 여러가지 변수가 서로 연관성이 있을때의 분포를 나타냅니다. 일차원 정규 분포와 마찬가지로 다변수 정규 분포 또한 여러개의 파라미터들로 정의될 수 있고 covariance(Σ)(\Sigma)를 통해 각각의 독립적인 정보가 얼마나 연관성이 있고 서로에게 영향을 끼치는지 파악합니다. 변수 XXYY의 간의 covariance는 C(X,Y)C(X, Y)로 표현합니다.

d 차원에서의 multi variate normal distribution

p(Xμ,Σ)=1(2π)dΣexp(12(xμ)TΣ1(xμ))p(X\:|\:\mu,\Sigma)= \frac{1}{\sqrt{(2\pi)^d|\Sigma|}}\text{exp}\bigg(-\frac{1}{2}(x-\mu)^{T}\Sigma^{-1}(x-\mu)\bigg)
  • x는 d 크기의 랜덤 벡터
  • μ\mu는 평균 벡터
  • Σ\Sigma(d×d)(d\times d)크기의 covariance matrix
  • Σ|\Sigma|는 행렬식

다변수 정규 분포 예시

두개의 예시를 한번 살펴보겠습니다.

  1. N([00],[1001])N\bigg(\begin{bmatrix}0\\0\end{bmatrix}, \begin{bmatrix}1&0\\0&1\end{bmatrix}\bigg)

여기서의는 2개의 변수를 갖는 정규 분포이며 x1x_1x2x_2의 coveriance가 0으로 초기화 되었기 때문에 2개의 변수는 독립관계인 것을 확인 할 수 있습니다.

  1. N([01],[10.80.81])N\bigg(\begin{bmatrix}0\\1\end{bmatrix}, \begin{bmatrix}1&0.8\\0.8&1\end{bmatrix}\bigg)

여기서의 covariance는 0과는 다르게 초기화 되었음으로 서로가 연관성이 있다고 볼 수 있습니다.

0개의 댓글