다변량 확률 분포 : 누적 분포 함수

STATS·2023년 6월 22일
0

수리통계학

목록 보기
9/40

다변량 누적 분포 함수

다변량 확률 분포에서도 일변량 확률 분포와 동일하게 누적 분포 함수(CDF)가 존재한다.
정의도 일변량에서와 동일하지만, 확률 변수가 여러 개라는 것만 다르다.

FX1,X2,...,Xn(x1,x2,...,xn)=P(X1x1,X2x2,...,Xnxn)F_{X_1, X_2, ..., X_n} (x_1, x_2, ..., x_n) = P(X_1 \le x_1, X_2 \le x_2, ..., X_n \le x_n)

다변량 누적 분포 함수는 서포트의 부분 집합에 대한 확률을 구하는 함수라고 생각할 수도 있다.
왜냐하면 기본적으로 CDF는 -\infin부터 xix_i까지의 누적된 확률을 구하는 함수지만, P(a<Xi<b)=FXi(b)FXi(a)P(a < X_i < b) = F_{X_i}(b) - F_{X_i}(a)라는 관계를 이용해 부분에 대한 확률을 구할 수도 있기 때문이다.

다변량 누적 분포 함수와 다변량 확률 함수의 관계

연속형 확률 변수에서, 확률 함수와 분포 함수는 미분과 적분의 관계를 가지고 있었다.
다변량 확률 분포에서도 동일하다. 다만 확률 변수가 여러 개이기 때문에 일변수에 대한 미적분이 아닌 편미분/편적분을 이용한다.

따라서 다음과 관계를 가진다.

FX1,X2,...,Xn(x1,x2,...,xn)=x1...xnfX1,X2,...Xn(w1,w2,...,wn)dwn...dw1F_{X_1, X_2, ..., X_n}(x_1, x_2, ..., x_n) = \int_{-\infin}^ {x_1}...\int_{-\infin}^{x_n}f_{X_1, X_2,...X_n}(w_1, w_2, ..., w_n)dw_n...dw_1
nx1x2...xnFX1,X2,...,Xn(x1,x2,...,xn)=fX1,X2,...Xn(x1,x2,...,xn)\frac{\partial^n}{\partial x_1x_2...x_n}F_{X_1, X_2, ..., X_n}(x_1, x_2, ..., x_n)=f_{X_1, X_2, ...X_n}(x_1, x_2, ..., x_n)

예를 들어 $fX1,X2(x1,x2)=4x1x2I(0<x1<1)I(0<x2<1)f_{X_1, X_2} (x_1, x_2) = 4x_1x_2 I(0 < x_1 < 1)I(0 < x_2 < 1)라고 결합 확률 함수가 주어졌을 때, 누적 분포 함수는 다음과 같이 구할 수 있다.

FX1,X2(x1,x2)=P(X1x1,X2x2)=0x10x24st dtds=x12x22I(0<x1<1)I(0<x2<1)F_{X_1, X_2}(x_1, x_2) = P(X_1 \le x_1, X_2 \le x_2) = \int_0^{x_1}\int_0^{x_2}4st\ dtds = x_1^2x_2^2 I(0 < x_1 < 1)I(0 < x_2 < 1)

누적 분포 함수와 확률 함수의 관계를 생각했을 때, CDF를 각 변수에 대해 미분하면

2x1x2FX1,X2(x1,x2)=2x1x2x12x22=4x1x2\frac{\partial^2}{\partial x_1x_2}F_{X_1, X_2}(x_1, x_2) = \frac{\partial^2}{\partial x_1x_2}x_1^2x_2^2 = 4x_1x_2

따라서 CDF를 미분하면 원래의 결합 확률 함수가 나오는 것을 알 수 있다.

0개의 댓글