확률이론과 확률분포

choyunjeong·2024년 12월 7일

확률 이론
반복시행마다 결과가 달라지는 사건을 비결정 수리모형으로 통계적 정규성을 규명하기 위하야 확률모형을 고려하기로 한다.

1.1. 표본공간과 사건

실험: 관찰결과를 얻기 위한 과정
표본공간: 모든 관찰 가능한 결과의 집합
사건: 표본 공간의 부분집합본 공간의 부분집합

표본공간 예시
동전 3회 던지는 실험의 표본공간

S={HHH,HHT,HTH,THH,HTT,THT,TTH,TTT}S=\{HHH,HHT,HTH,THH,HTT,THT,TTH,TTT\}

앞의 실험에서 앞면이 나오는 횟수

S={0,1,2,3}S=\{0,1,2,3\}

어떤 기계의 수명시간

S={x0x<}S=\{x|0\leq x<\infty\}

이 기계가 20시간 작동할 때

S={xx20}S=\{x|x\geq 20\}

사건 예시
주사위를 1회 던져 나오는 눈의 수를 관찰할 때 표본공간

S={0,1,2,3,4,5,6}S=\{0,1,2,3,4,5,6\}

짝수의 눈이 나오는 사건 A1A_1, 3의 배수가 나오는 사건 A2A_2

A1={2,4,6},A2={3,6}A_1 =\{2,4,6\},\quad A_2=\{3,6\}

1.2 확률의 정의

상대도수의 극한을 사용하는 방법이 가장 널리 받아들여지는 확률의 해석이다.

정의: 실험을 무한히 반복한다는 가정하에 상대도수 m/nm/n의 극한값을 사건 AA가 일어날 확률 P(A)P(A)로 정의

확률 공리

  1. 임의의 사건 AA에 대하여 P(A)0P(A)\geq0이다.
  2. P(S)=1P(S)=1이다.
  3. 표본공간 SS에 정의된 사건열 A1,A2,A_1,A_2,\ldots가 있다고 하자. 이제 모든 iji\neq j에 대하여 AiAj=A_i\cap A_j=\emptyset이면 P(i=1Ai)=i=1P(Ai)P(\bigcup_{i=1}^{\infty}A_i)=\sum_{i=1}^{\infty}P(A_i)이다.


주사위를 1회 던져 나오는 눈의 수를 관찰할 때 표본공간 S={0,1,2,3,4,5,6}S=\{0,1,2,3,4,5,6\}에 속한 값 모두 확률 1/61/6을 가졌다고 가정. 사건 A1A_1A2A_2

A1={2,4,6},A2={3,6}A_1 =\{2,4,6\},\quad A_2=\{3,6\}

으로 표현하면 A1A2={6}A_1\cap A_2=\{6\}, A1A2={2,3,4,6}A_1\cup A_2=\{2,3,4,6\}이 된다. 여기에서 사건의 합의 확률을 다음과 같이 구한다.

P(A1A2)=P(A1)+P(A2)P(A1A2)=36+2616=23\begin{aligned} P(A_1\cup A_2) &=P(A_1)+P(A_2)-P(A_1\cap A_2)\\ &=\frac{3}{6}+\frac{2}{6}-\frac{1}{6} \\ &=\frac{2}{3} \end{aligned}

2.1 확률변수의 정의

표본공간 SS는 수치적으로 또는 비수치적으로 표현될 수 있지만 많은 경우 실험결과로부터 계산될 수 있는 어떤 수치적인 양이 관심의 대상이 된다. 이 때 실험결과를 표현하는 이 수치적 양을 확률변수 (random variable)라고 정의한다. 확률 변수의 값은 랜덤하지만 그 값들이 나올 가능성은 미리 생각해볼 수 있으며, 이를 확률변수의 확률분포 (probability distribution)라고 한다.


동전을 3회 반복하였을 경우 관심 있는 변수로 XX(=앞면이 나오는 횟수)를 생각해 보자.
이 경우 표본공간 S={HHH, HHT, HTH, THH, HTT, THT, TTH, TTT}S=\{HHH,\ HHT,\ HTH,\ THH,\ HTT,\ THT,\ TTH,\ TTT\}
그에 대응하는 확률변수 XX는 다음과 같다. 이 때 앞면이 나오는 확률을 pp로 정의한다.

P(X=0)=P{TTT}=(1p)3P(X=1)=P{HTT,THT,TTH}=(1p)3P(X=2)=P{HHT,HTH,THH}=(1p)3P(X=3)=P{HHH}=(1p)3\begin{aligned} &P(X=0)=P\{TTT\}=(1-p)^3 \\[5pt] &P(X=1)=P\{HTT,THT,TTH\}=(1-p)^3 \\[5pt] &P(X=2)=P\{HHT, HTH, THH\}=(1-p)^3 \\[5pt] &P(X=3)=P\{HHH\}=(1-p)^3 \end{aligned}

2.2 확률밀도함수 및 확률분포함수

확률변수 XX의 확률밀도함수가 f(x)f(x)일 때, 변수 XX가 실직선상의 어떤 집합 A (a,b]A\ (a,b]에 속할 확률은

P(XA)=Af(x)dxP(X\in A)=\int_Af(x)dx

이다. (연속형만 표기)

결론

동전 3회 던지는 실험의 표본공간

S={HHH,HHT,HTH,THH,HTT,THT,TTH,TTT}S=\{HHH,HHT,HTH,THH,HTT,THT,TTH,TTT\}

에서 모두 앞면이 나오는 사건 A1A_1는 다음과 같다.

A1={H,H,H}A_1=\{H,H,H\}

이때 확률변수는 보통 수치적 양으로 앞면이 나오는 횟수로 표현 가능하며 사건 A1A_1이 일어날 확률은 다음과 같이 표기가 가능하다.

P(X=3)=P{H,H,H}=18P(X=3)=P\{H,H,H\}=\frac{1}{8}

사건이 더 다양하게 있을 때 A={A1,A2,}A=\{A_1,A_2,\ldots\} 또는 A=(a,b]A =(a,b] 의 확률변수의 예상값들을 확률분포로 표현할 수 있다. (연속형으로 표기)

P(XA)=Af(x)dxP(X\in A)=\int_Af(x)dx

2.3. 결합 및 조건부 확률분포

2.3.1. 결합 확률분포

kk개의 확률변수 X1,X2,,XkX_1,X_2,\ldots, X_k를 확률벡터 X=(X1,X2,,Xk)\bold{X}=(X_1,X_2,\ldots, X_k)로 표현하기도 한다.

P[(X,Y)A]=AfX,Y(x,y)dxdyP[(X,Y)\in A]=\int\int_A f_{X,Y}(x,y)dxdy


fX,Y(x,y)=xye(x+y),x>0, y>0f_{X,Y}(x,y)=xye^{-(x+y)}, \quad x>0,\ y>0으로 주어졌을 때 X2YX\geq 2Y의 확률은?

P(X2Y)=00x/2xye(x+y)dydxP(X\geq 2Y)=\int_{0}^{\infty}\int_{0}^{x/2}xye^{-(x+y)}dydx

2.3.2 주변 확률분포

두 확률변수의 결합에 관심이 있더라도 각 변수만의 분포를 구하고 싶은 경우

fX(x)=fX,Y(x,y)dy,fY(y)=fX,Y(x,y)dxf_X(x)=\int_{-\infty}^{\infty}f_{X,Y}(x,y)dy,\quad f_Y(y)=\int_{-\infty}^{\infty}f_{X,Y}(x,y)dx

증명

fX(x)=(d/dx)FX(x)=(d/dx)P(Xx,<Y<)=ddx[xfX,Y(u,y)dydu]=fX,Y(x,y)dy\begin{aligned} f_X(x) &=(d/dx)F_X(x) \\[5pt] &=(d/dx)P(X\leq x, -\infty<Y<\infty) \\[10pt] &=\frac{d}{dx}\left[\int_{-\infty}^{x}\int_{-\infty}^{\infty}f_{X,Y}(u,y)dydu\right] \\[10pt] &= \int_{-\infty}^{\infty}f_{X,Y}(x,y)dy \end{aligned}

2.3.3. 조건부 확률분포

몇 개의 변수값이 주어졌다는 조건하에 나머지 변수들의 분포에 대한 이론
X=xX=x가 주어졌을 때, YxY|x의 조건부 확률밀도함수는

fYx(yx)=fX,Y(x,y)fX(x),fX(x)>0f_{Y|x}(y|x)=\dfrac{f_{X,Y}(x,y)}{f_X(x)}, \quad f_X(x)>0

조건부 확률분포를 구하기 위해서 결합확률밀도함수의 식에서 조건에 맞는 주변부 확률밀도함수를 구한 후 계산:


fX,Y(x,y)=x2ex(y+1), (x>0, y>0)f_{X,Y}(x,y)=x^2e^{-x(y+1)},\ (x>0,\ y>0)에서 X=xX=x가 주어졌을 때 YxY|x의 조건부 확률밀도함수

조건부 확률밀도함수를 구하기 위해 먼저 XX의 주변부 확률밀도함수를 구한다.

fYx(yx)=fX,Y(x,y)fX(x)=x2ex(y+1)0x2ex(y+1)dy=exy0exydy=exy0(1/x)=xexy,y>0\begin{aligned} f_{Y|x}(y|x) &=\frac{f_{X,Y}(x,y)}{f_X(x)} \\[10pt] &=\dfrac{x^2e^{-x(y+1)}}{\int_{0}^{\infty}x^2e^{-x(y+1)}dy} \\[10pt] &=\dfrac{e^{-xy}}{\int_{0}^{\infty}e^{-xy}dy} \\[10pt] &=\dfrac{e^{-xy}}{0-(-1/x)} \\[10pt] &=xe^{-xy},\quad y>0 \end{aligned}

[참고문헌]

  • 수리통계학 제 5판 - 송성주, 전명식

0개의 댓글