해당 내용은 아래 강좌를 정리한 내용입니다.
https://www.edwith.org/ai152
학습목표
결합 분포를 통하여 주변 분포 및 조건부 분포를 구할 수 있으며, 독립 여부를 확인할 수 있다. 또한, 2차원 LOTUS를 이해할 수 있다.
핵심 키워드
- 결합 분포(conditional distribution)
- 주변 분포(marginal distribution)
- 조건부 분포(conditional distribution)
- 독립
- 2차원 LOTUS(무의식적인 통계학자의 법칙)
Joint, conditional, marginal distribution
joint CDF F(x,y)
F(x,y)=P(X≤x,Y≤y)
PDF와 사건집합에 해당하는 확률
f(x,y)=∂x∂y∂F(x,y)P(X,Y∈S)=∫∫Sf(x,y)dxdy
marginal PDF of X: 결합분포를 이용하여 주변분포를 구하는 법
f(x)=∫∞∞f(x,y)dy
conditional PDF of Y|X is (조건부 PDF)
fY∣X(y∣x)=fX(x)fX,Y(x,y)=fX(x)fX∣Y(x∣y)fY(y)
x가 주어졌을 때 y의 확률밀도 = x를 전체로 하고 x,y가 동시에 일어날 확률밀도
- 차원 관점으로 봤을 때도 위에는 면적을 곱해야 확률이고 밑에는 선을 곱해야 확률이므로 양 변에 다시 선을 곱하면 조건부 확률과 완전히 일치함.
- 베이즈룰과 똑같은 식이 성립함.
2D LOTUS
Let,we have joint distribution f(x,y),g(x,y) is a functionthen E(g(x,y))=∫∫g(x,y)f(x,y)dxdy
중요한 정리! - 두 변수의 기댓값
IF X,Y are indep, then E(XY) = E(X)E(Y)
(독립은 무상관을 포함하는 개념이라 여기서 두 변수는 무상관이다.)
proof
E(XY)=∫∫xyfX,Y(x,y)dxdy=∫∫xyfX(x)fY(y)dxdy(∵indep)=∫yfY(y)(∫xfX(x)dx)dy=E(X)∫yfY(y)dy (∵E(X) is constant)=E(X)E(Y)
2D LOTUS 예제
X,Y ~ i.i.d Unif(0,1) 일 때 find E|X-Y|
X,Y가 0~1 수직선 상의 한 점일 때 두 거리의 차이의 평균값.
E(∣X−Y∣)=∫∫∣x−y∣fX,Y(x,y)dxdy=∫∫∣x−y∣f(x)f(y)dxdy=∫∫∣x−y∣dxdy=2∫∫x>yx−y dxdy=2∫01∫y1x−y dxdy=1/3
Chicken-egg
N∼Pois(λ) eggs,each hatches Bern(p) ,indep. Let X=# hatch,Y=#don′t hatchSo X∣N∼Bin(N,p) and X+Y=NFind joint PMF of X,Y
이 문제는 상당히 난이도가 있는 문제였는데, 여기서 쉬운 문제로 만들기 위해 N을 알고 있다면 이라고 가정하는 것임. 전체확률의 법칙은 만능이다..
P(X=i,Y=j)=P(X=i,Y=j,N=1)+P(X=i,Y=j,N=2)+..=n=0∑∞P(X=i,Y=j,N=n)=n=0∑∞P(X=i,Y=j∣N=n)P(N=n)=n=0∑∞(in)pipn−iP(N=n)
여기서 n-i 가 j가 아닐 경우 확률은 0임
P(X=i,Y=j)=(ii+j)piqjP(N=i+j)=i!j!(i+j)!piqj(i+j)!e−λλi+j=e−λppiλi e−λqqjλj/(i!j!)=P(X=i)P(Y=j)
이 결과 X와 Y는 모두 포아송 분포를 따름.
따라서 X,Y가 독립임. 이건 N이 포아송 분포를 따를 때에만 성립함. 근데 여기서 포아송 분포를 안따르고 저 식을 만들 수는 없나? 독립이라고 단언할 수 있나?
→ 그렇다. 기본적으로 결합확률 분포를 알면 주변확률분포를 알 수 있음