확률 변수의 함수와 변환 (일변량)

STATS·2023년 6월 20일
0

수리통계학

목록 보기
7/40

확률 변수의 함수와 변환

확률 변수 XX의 확률 함수나 분포 함수를 알고 있다고 할 때, XX에 관한 함수 Y=g(X)Y = g(X)의 분포를 알고 싶은 경우가 있다. XX의 분포 정보를 바탕으로 g(X)g(X)의 분포를 알아내는 과정을 확률 변수의 변환이라고 한다.

확률 변수의 변환은 다양한 분포를 다루기 위한 효과적인 방법이며, 복잡한 분포를 더 단순한 형태로 변환하는 데 유용하게 사용된다.

대표적인 경우로 XX를 평균과 표준 편차로 표준화 시킬 때, Y=XμσY = \frac{X-\mu}{\sigma}라는 X에 대한 함수를 이용한다. 여기서는 g(X)=Xμσg(X) = \frac{X - \mu}{\sigma}가 될 것이다.
표준화를 할 경우 YY의 값은 XX가 평균으로부터 몇 표준편차 떨어져 있는지로 해석할 수 있다. 즉 표준편차라는 단위가 생기므로 서로 다른 자료라도 각각의 표준편차를 이용해 비교할 수 있게 된다.

확률 변수의 변환은 확률 변수가 이산형인지, 연속형인지에 따라 방법이 조금씩 다르다. 따라서 각 케이스에 따라 살펴보자.

이산형 확률 변수

  1. g(X)g(X)가 단조함수인 경우
    g(X)g(X)가 단조함수이면 각각의 XX값과 g(X)g(X)값이 하나씩 대응된다. 그리고 g(X)g(X)의 역함수가 존재하기 때문에 다음이 성립한다.
P(Y=y)=P(g(X)=y)=P(X=g1(y))P(Y = y) = P(g(X) = y) = P(X = g^{-1}(y))

예를 들어 P(X=x)=(3x)(23)x(13)3xI(x{0,1,2,3})P(X = x) = \binom{3}{x}(\frac{2}{3})^x(\frac{1}{3})^{3-x}I(x \in \{0, 1, 2, 3\})라고 하자.
이 때 Y=X2Y = X^2라고 하면 일반적으로 YY의 역함수는 존재하지 않는다. 그러나 XX의 서포트가 {0,1,2,3}\{0, 1, 2, 3\} 이므로, X=g1(Y)=YX = g^{-1}(Y) = \sqrt{Y}가 성립한다.

따라서 P(Y=y)=P(X=Y)P(Y = y) = P(X = \sqrt{Y})이므로, YY의 확률 함수는 다음과 같다.

P(Y=y)=(3y)(23)y(13)3yI(y{0,1,4,9})P(Y = y) = \binom{3}{\sqrt{y}}(\frac{2}{3})^{\sqrt{y}}(\frac{1}{3})^{3- \sqrt{y}}I(y \in \{0, 1, 4, 9\})
  1. g(X)g(X)가 단조함수가 아닌 경우
    g(X)g(X)가 단조함수가 아닌 경우에 보편적으로 쓸 수 있는 방법론은 없다. 대신 XX의 서포트의 모든 원소를 각각 g(X)g(X)에 넣어 YY의 서포트를 완성하고, P(Y=y)P(Y = y)를 각각의 yy마다 계산해서 구해야 한다.

예를 들어 P(X=x)=14I(x{2,0,1,2})P(X = x) = \frac{1}{4}I(x \in \{-2, 0, 1, 2\})라고 하고, Y=X4Y = X^4라고 하자.

X4X^4는 역함수가 존재하지 않고, XX의 서포트의 원소도 음수와 양수를 모두 포함하므로 첫번째 방법을 사용할 수 없다.

따라서 YY의 서포트를 구하면 RY={0,1,16}R_Y = \{0, 1, 16\}이고, P(Y=y)P(Y = y)는 다음과 같다.

P(Y=y)={P(X=0)  (y=0)P(X=1)  (y=1)P(X=2)+P(X=2)  (y=16)P(Y = y)= \begin{cases} P(X = 0) \ {} \ (y = 0)\\ P(X = 1) \ {} \ (y = 1)\\ P(X = -2) + P(X = 2) \ {} \ (y = 16) \end{cases}

연속형 확률 변수

연속형 확률 변수의 변환은 분포 함수와 확률 함수가 미분과 적분으로 표현 가능하다는 것을 이용한다.

  1. g(X)g(X)가 단조함수인 경우
    이 경우 g(X)의 역함수가 존재하기 때문에 역함수의 미분법을 이용해 확률변수의 변환을 할 수 있다.
FY(y)=P(Yy)=P(g(X)y)F_Y(y) = P(Y \le y) = P(g(X) \le y)

이 부분에 주의할 점은, g(X)g(X)가 단조증가냐 단조감소냐에 따라 부등호의 방향이 바뀐다는 것이다.

FY(y)=P(Yy)=P(g(X)y)=P(Xg1(y))=FX(g1(y))F_Y(y) = P(Y \le y) = P(g(X) \le y) = P(X \le g^{-1}(y)) = F_X(g^{-1}(y))

만약 단조증가라면 위와 같이 YY의 분포 함수를 구할 수 있다.
따라서 YY의 확률 함수는 다음과 같다.

fY(y)=fX(g1(y))ddyg1(y)f_Y(y) = f_X(g^{-1}(y))\frac{d}{dy}g^{-1}(y)

단조감소인 경우의 YY의 분포함수는 아래와 같다. 이를 y에 대해 미분하면 단조증가의 경우와 마찬가지로 YY의 확률 함수를 구할 수 있다.

FY(y)=P(Yy)=P(g(X)y)=P(Xg1(y))=1FX(g1(y))F_Y(y) = P(Y \le y) = P(g(X) \le y) = P(X \ge g^{-1}(y)) = 1-F_X(g^{-1}(y))
fY(y)=fX(g1(y))ddyg1(y)f_Y(y) = -f_X(g^{-1}(y))\frac{d}{dy}g^{-1}(y)
  1. g(X)g(X)가 단조함수가 아닌 경우
    예를 들어 Y=X2Y=X^2인 경우를 살펴보자. YY의 분포 함수는 다음과 같이 구할 수 있다.
FY(y)=P(Yy)=P(X2y)=P(yXy)=P(Xy)P(Xy)=FX(y)FX(y)F_Y(y) = P(Y \le y) = P(X^2 \le y) = P(-\sqrt{y} \le X \le \sqrt{y}) \\ = P(X \le \sqrt{y}) - P(X \le -\sqrt{y}) = F_X(\sqrt{y}) - F_X(-\sqrt{y})

따라서 g(X)g(X)의 역함수가 존재하지 않는 경우는 X와 y에 관한 부등식을 조작해서 FX(h(y))F_X(h(y))꼴로 만들어 YY의 분포 함수를 구한다.

0개의 댓글