확률변수의 함수

yst3147·2022년 8월 12일

수리통계학

목록 보기
6/10

Wackerly et al., Mathematical Statistics with Applications을 읽고
책 내용을 정리하였습니다.

6.1 서론

6.2 확률변수들의 함수의 확률분포 구하기

  • 분포함수법
  • 변수변환법
  • 적률생성함수법

6.3 분포함수법

분포함수법의 개요

UU를 확률변수 Y1,Y2,...,YnY_1, Y_2, ..., Y_n의 함수라 하자
1. (y1,y2,...,yn)(y_1, y_2, ..., y_n) 공간에서 U=uU=u 영역을 구한다.
2. UuU \leq u 영역을 구한다.
3. UuU \leq u 영역에서 f(y1,y2,...,yn)f(y_1, y_2, ..., y_n)을 적분하여 Fu(u)=P(Uu)F_u(u) = P(U \leq u)를 구한다.
4. FU(u)F_U(u)를 미분하여 밀도함수 fU(u)f_U(u)를 구한다. 그러므로 fU(u)=dFu(u)duf_U(u) = dF_u(u)du이다.

6.4 변수변환법

변수변환법

YY는 확률밀도함수 fY(y)f_Y(y)를 갖는다고 하자.
만일 h(y)h(y)fY(y)>0f_Y(y) > 0인 모든 y에 대해 증가함수거나 감소함수이면,
U=h(Y)U = h(Y)는 다음의 밀도함수를 갖는다

fU(u)=fY[h1(u)]dh1duf_U(u) = f_Y[h^-1(u)]|\frac {dh^-1}{du}|, 여기서 dh1du=d[h1(u)]du\frac {dh^-1}{du} = \frac {d[h^-1(u)]}{du}

  • 여기서 점들의 집합 y:fY(y)>0{y:f_Y(y) > 0}을 밀도함수 fY(y)f_Y(y)받침(support)라 한다.

변수변환법 개요

U=h(Y)U = h(Y)라 하자.
여기서 h(y)h(y)fY(y)>0f_Y(y) > 0인 모든 yy에 대해 yy의 증가함수이거나 혹은 감소함수이다.
1. 역함수 y=h1(u)y = h^-1(u)를 구한다.
2. dh1du=d[h1(u)]du\frac{dh^{-1}}{du} = \frac{d[h^-1(u)]}{du} 를 계산한다.
3. 다음 식에 의해 fU(u)f_U(u)를 구한다.

fU(u)=fY[h1(u)]dh1duf_U(u) = f_Y[h^-1(u)]|\frac {dh^-1}{du}|

6.5 적률생성함수법

유일성 정리

mX(t)m_X(t)mY(t)m_Y(t)는 각각 확률변수 XXYY의 적률생성함수라 하자.
만일 적률생성함수가 모두 존재하고 tt의 모든 값에 대해 mX(t)=mY(t)m_X(t) = m_Y(t)이면,
XXYY는 동일한 확률분포를 갖는다.

적률생성함수법

Y1,Y2,...YnY_1, Y_2, ... Y_n은 독립이며 각각 적률생성함수 mY1(t),mY2(t),...,mYn(t)m_{Y_1}(t), m_{Y_2}(t), ..., m_{Y_n}(t)를 갖는 확률변수라 하자.
만일 U=Y1+Y2+...+YnU = Y_1 + Y_2 + ... + Y_n이라 하면, 다음이 성립
mU(t)=mY1(t)×mY2(t)×...×mYn(t)m_U(t) = m_{Y_1}(t) \times m_{Y_2}(t) \times ... \times m_{Y_n}(t)

평균 및 분산

Y1,Y2,...YnY_1, Y_2, ... Y_n은 독립이며
i=1,2,...,ni = 1,2, ..., n에 대해 E(Yi)=μiE(Y_i) = \mu_i 이고 V(Yi)=σi2V(Y_i) = \sigma_i^2인 정규분포를 따르는 확률변수이고
a1,a2,...,ana_1, a_2, ..., a_n은 상수라 하자.

U=i=1naiYi=a1Y1+a2Y2+...+anYnU = \sum_{i=1}^{n}a_iY_i = a_1Y_1 + a_2Y_2 + ... + a_nY_n
이라 하면, UU는 다음의 평균과 분산을 갖는 정규분포를 따른다.
E(U)=i=1naiμi=a1μ1+a2μ2+...+anμnE(U) = \sum_{i=1}^{n}a_i\mu_i = a_1\mu_1 + a_2\mu_2 + ... + a_n\mu_n
그리고
V(U)=i=1naiσi2=a1σ12+a2σ22+...+anσn2V(U) = \sum_{i=1}^{n}a_i\sigma^2_i = a_1\sigma^2_1 + a_2\sigma^2_2 + ... + a_n\sigma^2_n

카이제곱분포

Y1,Y2,...YnY_1, Y_2, ... Y_n은 독립이며
ZiZ_i
Zi=Yiμiσi,i=1,2,...,nZ_i = \frac{Y_i - \mu_i}{\sigma_i}, i = 1,2,...,n
로 정의하면,
i=1nZi2\sum_{i=1}^{n}Z_i^2은 자유도가 nnχ2\chi^2분포를 따른다.

적률생성함수법의 개요

UU를 확률변수 Y1,Y2,...,YnY_1, Y_2, ..., Y_n의 함수라 하자.
1. UU의 적률생성함수 mU(t)m_U(t)를 구한다.
2. mU(t)m_U(t)를 잘 알려진 다른 적률생성함수들과 비교한다.
만일 t의 모든 값에 대해 mU(t)=mV(t)m_U(t) = m_V(t)이면,
정리 6.1에 의해 U,VU, V가 동일한 분포를 갖는다.

6.6 야코비안을 이용한 다변량 변환(선택)

이변량 변수변환법

Y1,Y2Y_1, Y_2가 결합밀도함수 fY1,Y2(y1,y2)f_{Y_1, Y_2}(y_1, y_2)를 갖는 연속확률변수이고
fY1,Y2(y1,y2)>0f_{Y_1, Y_2}(y_1, y_2) > 0인 모든 (y1,y2)(y_1, y_2)에 대해
u1=h1(y1,y2),u2=h2(y1,y2)u_1 = h_1(y_1, y_2), u_2 = h_2(y_1, y_2)

y1=h11(u1,u2),y2=h21(u1,u2)y_1 = h_1^{-1}(u_1, u_2), y_2 = h_2^{-1}(u_1, u_2)
인 역함수를 갖는 (y1,y2)(y_1, y_2)에서 (u1,u2)(u_1, u_2)로의 일대일 함수라고 가정한다.
만일 h11(u1,u2)h_1^{-1}(u_1, u_2)h21(u1,u2)h_2^{-1}(u_1, u_2)u1,u2u_1, u_2에 관해 연속인 편도함수를 갖고 야코비안(Jacobian)

J=det[h11u1h11u2h21u1h21u2]=h11u1h21u2h21u1h11u20J = det\begin{bmatrix} \frac{\partial h_1^{-1}}{\partial u_1} & \frac{\partial h_1^{-1}}{\partial u_2} \\ \frac{\partial h_2^{-1}}{\partial u_1} & \frac{\partial h_2^{-1}}{\partial u_2} \end{bmatrix} = \frac{\partial h_1^{-1}}{\partial u_1}\frac{\partial h_2^{-1}}{\partial u_2} - \frac{\partial h_2^{-1}}{\partial u_1}\frac{\partial h_1^{-1}}{\partial u_2} \neq 0

이면, U1,U2U_1, U_2의 결합밀도함수는 다음과 같다.
fU1,U2(u1,u2)=fY1,Y2(h11(u1,u2),h21(u1,u2))Jf_{U_1, U_2}(u_1, u_2) = f_{Y_1, Y_2}(h_1^{-1}(u_1, u_2), h_2^{-1}(u_1, u_2))|J|
여기서 J|J|는 야코비안의 절댓값

6.7 순서통계량

순서통계량(order statistic)

순서가 정해진 변수

순서통계량 결합밀도함수

Y1,Y2,...,YnY_1, Y_2, ..., Y_n은 독립이며 공통 분포함수 F(y)F(y)와 공통 밀도함수 f(y)f(y)를 갖는 동일하게 분포된 연속확률변수라 하자.
Y(k)Y_{(k)}kk번째 순서통계량이라면, Y(k)Y_{(k)}의 밀도함수는 다음과 같다.

g(k)(yk)=n!(k1)!(nk)![F(yk)]k1[1F(yk)]nkf(yk),<yk<g_{(k)}(y_k) = \frac{n!}{(k-1)!(n-k)!}[F(y_k)]^{k-1}[1-F(y_k)]^{n-k}f(y_k), -\infin < y_k < \infin

만일 j,kj, k1j<kn1 \leq j < k \leq n인 두 정수라 하면, Y(j),Y(k)Y_{(j)}, Y_{(k)}의 결합밀도함수는 다음과 같다.

g(j)(k)(yj,yk)=n!(j1)!(k1j)!(nk)![F(yj)]j1×[F(yk)F(yj)]k1j×[1F(yk)]nkf(yj)f(yk),<yj<yk<g_{(j)(k)}(y_j, y_k) = \frac{n!}{(j-1)!(k-1-j)!(n-k)!}[F(y_j)]^{j-1} \\ \times [F(y_k) - F(y_j)]^{k-1-j} \times [1-F(y_k)]^{n-k}f(y_j)f(y_k), -\infin < y_j < y_k < \infin

6.8 요약

0개의 댓글