아래 내용에 관한 증명은 PRML에서 참고할 수 있다.
가우시안 분포(Gaussian Distribution)
가우시안 분포가 일어나는 여러가지 상황: 정보이론에서 엔트로피를 최대화시키는 확률분포, 중심극한정리
-
단일변수 x
-
D차원 벡터 x
여기서 μ는 D차원의 평균 벡터이고, Σ는 D x D 크기를 가지는 공분산 행렬이다. 중요한 것은 μ와 Σ가 평균, 공분산으로 주어진 것이 아니고 이것들이 파라미터로 주어진 확률밀도함수의 평균과 공분산이 μ,Σ가 된다는 것이다.
가우시안 분포의 기하학적인 형태
-
x에 대한 함수적 종속성은 지수부에 등장하는 이차형식(quadratic form)에 있다. Σ가 공분산으로 주어진 것이 아니지만, 이차형식에 나타나는 행렬은 오직 대칭부분만이 그 값에 기여하므로 Σ가 대칭행렬인 것으로 간주할 수 있다.
-
대칭행렬의 성질에 따라서 Σ를 아래와 같이 나타낼 수 있다.
-
이차형식은 다음과 같이 표현될 수 있다.
-
y를 벡터들 ui에 의해 정의된 새로운 좌표체계 내의 점으로 해석할 수 있다. 이것을 기저변환(change of basis)이라고 한다.
- x−μμ: standard basis에서의 좌표
- y: basis {u1,...,uD}에서의 좌표
가우시안 분포의 Normalization
가우시안 분포의 기댓값과 공분산
- 다변량 확률변수의 기댓값
- x=(x1,...,xn)T
- E[x]=(E[x1],...,E[xn])T
- E[x1]=∫x1p(x1)dx1=∫x1(∫p(x1,...,xn)dx2,...,dxn)dx1=∫x1p(x1,...,xn)dx1,...,dxn
- 가우시안 분포의 기댓값, 공분산
- E[x]=μμ
- cov[x]=Σ
조건부 가우시안 분포(Conditional Gaussian Distributions)
두개의 확률 변수의 결합 확률 분포가 가우시안이면, 조건부 확률 분포도 가우시안 분포가 된다. 이 때 두 개의 주변(marginal) 확률 분포도 가우시안 분포가 된다.
즉, p(xa,xb) 가 가우시안 분포를 따르는 경우, p(xa∣xb) 도 가우시안 분포를 따르게 된다.
주변 가우시안 분포(Marginal Gaussian Distributions)
-
주변 확률 분포
- 결합 확률 분포에서 한 쪽의 변수가 사라지거나 무시되는 것
- p(x,y)에서 x에 대한 주변 확률 분포는 p(x)가 되며, y에 대한 주변 확률 분포는 마찬가지로 p(y)가 된다.
- 이산 변수는 모든 확률 값의 합으로, 연속 변수의 경우 적분으로 합산하여 한 쪽의 변수를 사라지게 한다.
-
주변 확률 분포 또한 가우시안 분포가 된다.
- E[xa]=μμa
- cov[xa]=Σaa