주변 확률 함수
결합 확률 함수는 n개의 확률 변수를 모아 놓은 확률 벡터에 대한 확률 함수로 생각할 수 있었다.
반대로 결합 확률 함수를 알고, 그 중 한 확률 변수의 확률 함수를 알고 싶을 때는 주변 확률 함수를 이용하면 된다. 예를 들어 fX1,X2,...,Xn(x1,x2,...,xn)을 알 때, X1의 확률 함수를 알고 싶다면 결합 확률 함수에서 X1의 주변 확률 함수를 추출할 수 있다.
더 구체적인 예시로, 이전에 사용했던 과목 별 수능 점수에 대한 표본 공간 Ω를 이용하자.
Ω=(K,M,E)∣0≤K≤100,0≤M≤100,0≤E≤100
그리고 확률 변수 X를 학생의 수학 점수, 확률 변수 Y를 학생의 영어+국어 점수라고 정의하자.
그렇다면 X,Y의 결합 확률 함수는 pX,Y(x,y)로 주어진다.
만약 알고 싶은 것이 오직 학생의 수학 점수라고 하자. 그렇다면 X와 Y의 결합 확률 함수로부터 X의 확률 함수를 추출 할 수 있어야 한다. 혹은 pX(x)를 구할 수 있어야 한다.
파티션을 이용한 주변 확률 함수 도출
X의 확률 함수를 추출하기 위해 파티션을 이용하면 다음과 같다.
pX(x)=pX,Y(X=x,Y=0)+pX,Y(X=x,Y=1)+...+pX,Y(X=x,Y=100)
왜냐하면 Y=0,Y=1,...,Y=100은 MECE 조건을 만족하기 때문에, 사건 pX(x)=P(X=x)은 ∑i=0100pX,Y(X=x,Y=i)와 동일하다.
이를 일반화하면 이산 확률 변수와 연속 확률 변수의 주변 확률 함수를 다음과 같이 구할 수 있다.
이산 확률 변수의 주변 확률 함수
pX(x)=RY∑pX,Y(x,y)
연속 확률 변수의 주변 확률 함수
fX(x)=∫RYfX,Y(x,y)dy
조건부 확률 함수
조건부 확률은 표본 공간을 Ω 내의 특정 사건으로 축소시켰을 때, Ω 내의 어떤 사건이 일어날 확률이었다.
그리고 확률 변수의 서포트도 표본 공간으로 볼 수 있었기 때문에, 확률 변수 간에도 조건부 확률 함수를 정의할 수 있다.
예를 들어 위의 예시에서 수학이 70점인 학생의 언어 영역 점수 합이 80~100점 사이일 확률을 구하고 싶다면,
P(80<Y<100∣X=70)=P(X=70)P(X=70,80<Y<100)
위의 조건부 확률을 계산하면 된다.
이산 확률 변수의 조건부 확률 함수
P(X=x∣Y=y)=P(Y=y)P(X=x,Y=y)=pY(y)pX,Y(x,y)
연속 확률 변수의 조건부 확률 함수
이산 확률 변수의 경우와 달리, 확률 밀도 함수의 함수값은 확률을 의미하지 않기 때문에 조건부 확률을 새로 정의해야 한다.
fX(x∣y)=fY(y)fX,Y(x,y)
연속 확률 변수의 조건부 확률 함수도 표본 공간을 Y=y로 한정 했을 때의 X의 확률 함수로 볼 수 있다.