다변량 확률 분포 : 주변 확률 함수, 조건부 확률 함수

STATS·2023년 6월 24일
0

수리통계학

목록 보기
10/40

주변 확률 함수

결합 확률 함수는 nn개의 확률 변수를 모아 놓은 확률 벡터에 대한 확률 함수로 생각할 수 있었다.
반대로 결합 확률 함수를 알고, 그 중 한 확률 변수의 확률 함수를 알고 싶을 때는 주변 확률 함수를 이용하면 된다. 예를 들어 fX1,X2,...,Xn(x1,x2,...,xn)f_{X_1, X_2, ..., X_n}(x_1, x_2, ..., x_n)을 알 때, X1X_1의 확률 함수를 알고 싶다면 결합 확률 함수에서 X1X_1의 주변 확률 함수를 추출할 수 있다.

더 구체적인 예시로, 이전에 사용했던 과목 별 수능 점수에 대한 표본 공간 Ω\Omega를 이용하자.

Ω=(K,M,E)0K100,0M100,0E100Ω={(K,M,E)∣0≤K≤100,0≤M≤100,0≤E≤100}

그리고 확률 변수 X를 학생의 수학 점수, 확률 변수 Y를 학생의 영어+국어 점수라고 정의하자.
그렇다면 X,YX, Y의 결합 확률 함수는 pX,Y(x,y)p_{X, Y}(x, y)로 주어진다.

만약 알고 싶은 것이 오직 학생의 수학 점수라고 하자. 그렇다면 X와 Y의 결합 확률 함수로부터 X의 확률 함수를 추출 할 수 있어야 한다. 혹은 pX(x)p_X(x)를 구할 수 있어야 한다.

파티션을 이용한 주변 확률 함수 도출

XX의 확률 함수를 추출하기 위해 파티션을 이용하면 다음과 같다.

pX(x)=pX,Y(X=x,Y=0)+pX,Y(X=x,Y=1)+...+pX,Y(X=x,Y=100)p_X(x) = p_{X, Y}(X=x, Y= 0) + p_{X, Y}(X=x, Y= 1) + ...+ p_{X, Y}(X=x, Y= 100)

왜냐하면 Y=0,Y=1,...,Y=100Y=0, Y=1, ..., Y=100은 MECE 조건을 만족하기 때문에, 사건 pX(x)=P(X=x)p_X(x) = P(X=x)i=0100pX,Y(X=x,Y=i)\sum_{i=0}^{100} p_{X, Y} (X= x, Y = i)와 동일하다.

이를 일반화하면 이산 확률 변수와 연속 확률 변수의 주변 확률 함수를 다음과 같이 구할 수 있다.

이산 확률 변수의 주변 확률 함수

pX(x)=RYpX,Y(x,y)p_{X}(x) = \sum_{R_Y}p_{X, Y}(x, y)

연속 확률 변수의 주변 확률 함수

fX(x)=RYfX,Y(x,y)dyf_X(x)= \int_{R_Y}f_{X, Y}(x, y)dy

조건부 확률 함수

조건부 확률은 표본 공간을 Ω\Omega 내의 특정 사건으로 축소시켰을 때, Ω\Omega 내의 어떤 사건이 일어날 확률이었다.

그리고 확률 변수의 서포트도 표본 공간으로 볼 수 있었기 때문에, 확률 변수 간에도 조건부 확률 함수를 정의할 수 있다.

예를 들어 위의 예시에서 수학이 70점인 학생의 언어 영역 점수 합이 80~100점 사이일 확률을 구하고 싶다면,

P(80<Y<100X=70)=P(X=70,80<Y<100)P(X=70)P(80 < Y < 100 \lvert X = 70) = \frac{P(X = 70, 80 < Y < 100)}{P(X = 70)}

위의 조건부 확률을 계산하면 된다.

이산 확률 변수의 조건부 확률 함수

P(X=xY=y)=P(X=x,Y=y)P(Y=y)=pX,Y(x,y)pY(y)P(X=x \lvert Y = y) = \frac{P(X=x, Y=y)}{P(Y=y)} = \frac{p_{X, Y}(x, y)}{p_Y(y)}

연속 확률 변수의 조건부 확률 함수

이산 확률 변수의 경우와 달리, 확률 밀도 함수의 함수값은 확률을 의미하지 않기 때문에 조건부 확률을 새로 정의해야 한다.

fX(xy)=fX,Y(x,y)fY(y)f_{X}(x \lvert y) = \frac{f_{X, Y}(x, y)}{f_{Y}(y)}

연속 확률 변수의 조건부 확률 함수도 표본 공간을 Y=y{Y=y}로 한정 했을 때의 XX의 확률 함수로 볼 수 있다.

0개의 댓글