해당 내용은 아래 강좌를 정리한 내용입니다.
https://www.edwith.org/ai152
학습목표
적률생성함수를 이용하여 적률을 구할 수 있다. 결합분포를 이용하여 주변분포를 구할 수 있고, 확률분포의 독립 여부를 판단할 수 있다.
핵심 키워드
- 적률생성함수(moment generating function)
- 적률(~th moment)
- 결합분포(joint distribution)
- 주변분포(marginal distribution)
- 독립(independent)
적률은 관성 모멘트로부터 통계학으로 넘어옴.
일단 적률 적분 계산을 미분 계산으로 바꾼다는 것에도 큰 의의가 있음.
X∼Expo(1)M(t)=1−t1,t<11−t1=0∑∞tn=∑n!n!tn=>E(Xn)=n!Y∼Expo(λ),let X=λY∼Expo(1),E(Yn)=E(Xn/λn)=n!/λ
이와 마찬가지로 정규분포의 적률을 구하고 싶을 때 표준 정규분포의 적률을 이용하여 구할 수 있음.
2n으로 계산하는게 편해서 2n으로 바꿔준거임 그냥 해도 됨.
포아송 분포의 MGF
X∼Pois(λ)E(etx)=k=0∑∞etx f(x)=k=0∑∞etxe−λλk/k!=e−λeλet
적률 분포를 이용하는 또 하나의 방법은 X+Y와 같은 확률변수 2개의 합을 구할 때 사용하는 것이다.
Y∼Pois(μ)Find distribution of X+Yif X,Y are independent, MGFXMGFY=MGFX+Yeλ(et−1)+μ(et−1)=e(λ+μ)(et−1)X+Y∼ Pois(λ+μ)
포아송 분포의 특이한 점은 자기끼리 곱해도 포아송 분포 꼴이 나온다는 것임.
이때 이 정리를 사용하기 위한 조건은 독립이었는데 만약 완전 종속적인 경우에 어떻게 되는지 한번 보자.
종속적인 경우의 대표적인 예는 X=Y인 경우이다. 이럴 경우 포아송 분포가 나오지 않게 되는데 이럴 떈 평균과 분산을 계산해보면 됨. 포아송 분포의 가장 큰 특징은 평균과 분산이 람다로 같은 것인데 E(2X) = 2람다, V(2X) = 4람다로 다름. 그리고 포아송은 입력값으로 0부터 모든 양의 정수가 들어가야 하는데 2X는 짝수만 들어갈 수 있으므로 아님.
결합 분포 (Joint distribution)
joint라는 말은 두 변수 이상을 신경쓰고 있다는 말임.
marginal 뜻은 한 변수만 고려한다는 뜻
joint CDF, joint PMF (discrete)
F(x,y)=P(X≤x,Y≤y)P(X=x,Y=y)
joint PDF
f(x,y), P((x,y)∈B)=∫∫f(x,y)dxdy
확률 변수의 독립이란 X와 Y가 다음을 만족하면 독립이라고 한다. cdf조건을 만족하면 모두 성립한다. 그리고 독립이라면
F(x,y)=FX(x)FY(y)equvalnt to P(X=x,Y=y)=P(X=x)P(Y=y),discretef(x,y)=fX(x)fY(y),conti
독립임을 밝히기 위해서는 주변 분포(marginal)를 구해야함. 결합 분포로부터 주변 분포를 구하는 것을 marginalizing이라고함.
marginalize :P(X=x)=y∑P(X=x,Y=y)fY(y)=∫xfX,Y(x,y)dx
적분 안에 있는 확률밀도함수를 결합 확률밀도함수 라고 함.