10강 - 기댓값

MostlyFor·2023년 1월 9일
0

확률론

목록 보기
9/20

해당 내용은 아래 강좌를 정리한 내용입니다.
https://www.edwith.org/ai152

학습목표

기댓값의 선형성을 증명할 수 있으며, 음이항분포와 First Success 분포를 기하확률분포를 통하여 유도할 수 있다.

핵심 키워드

  • 선형성
  • 음이항분포(negative binomial)
  • First Success 분포

기댓값의 선형성 증명 (이거 조약돌 원리로 증명 하셨는데 굳이 할 필요 없을 것 같음)

확률변수 T = X+Y 라고 할 때 E(T) = E(X)+E(Y) 임을 증명.

음이항분포(negative binomial)

→ 사실상 음이항 분포는 이항분포와 크게 관련이 없고 기하분포의 일반화임.

2개의 parameters (r,p)

기하 분포가 베루누이 시행에서 첫번째 성공까지의 실패 횟수에 관련된 분포였다면 이는 r개의 성공을 원하는 경우임.

음이항분포의 PMF :

X ~NegBin(r,p) 독립시행 중 r번째 성공까지의 실패 횟수

P(X=n)=(r+n1n)pr(1p)nP(X=n)=\binom{r+n-1}{n}p^{r}(1-p)^{n}

예를 들어 , 1001000100001000001 일 경우 X=14인 사건임. 이때 모든 사건은
r번째 성공에서 끝남. 그리고 1 이전의 성공/실패 순서가 바뀐다고 해도 확률은 같음.

음이항분포의 식이 이항정리와 비슷해서 음이항분포라고 불린다고 함.

음이항분포의 expactation

E(X)=nnp(X=n)E(X)=\sum\limits_n np(X=n)

원칙적으로는 다음과 같지만 우리는 직관을 통해서 해결할 수 있음.

음이항분포는 기하분포의 일반화이므로 기하분포를 이용할 예정임. 기하분포는 음이항분포에서 실패횟수(r)=1인 경우다. 이때 기하분포의 기댓값은 q/p였다.

이를 이용하여 식을 전개해보자. with 선형성

E(X)=E(X1+X2+..+Xr)=E(X1)+E(X2)+...+E(Xr)=qp+qp+qp...=rqpE(X) = E(X_1+X_2+..+X_r) \\=E(X_1)+E(X_2)+...+E(X_r)\\ =\frac{q}{p}+\frac{q}{p}+\frac{q}{p}...=\frac{rq}{p}

X_k : k-1번째에서 k번째 성공 까지의 실패 횟수

기하분포 응용

X~FS(p) time until by success 첫 번째 성공까지 걸린 시도의 수

기하분포는 실패횟수를 세는 것인데 이건 시도의 수임 따라서 1 차이남.

Let Y = X - 1 이라고 하면 Y~Geom(p)를 따름. 즉, Y 를 이용하여 기댓값을 구하면 됨.

결과는 q/p -1이므로 1/p가 되는데 이는 상당히 직관적임 동전이 앞면이 나올때까지 예상되는 시도 횟수는 당연히 2번임.

  1. 기댓값에 관련된 어려운 문제를 풀 땐 사건을 분할(지시확률변수)하자!!

→ Expactation of Local maxima

  1. 상트페테르부르크 역설 (기하분포 문제)

동전의 앞면이 나올 떄까지 동전 던짐. n번째 시도에서 처음으로 앞면이 나오면 2^n 달러를 받게됨. 이때 이 게임을 하기 위해 얼마를 내야 손해를 안볼까?

X ~ 기하분포 ( p ) : 성공이 나올 때 까지의 시도 횟수 + 1

E(X) = 1/p = 2

E(2^X) = ?? 이게 문제에서 묻는 것

E(2X)=n2nP(X=n)P(X=n)=q(n1)p=(1/2)nE(2X)=1+1+1+...+1=infE(2^X)=\sum_n 2^nP(X=n)\\ P(X=n)=q^{(n-1)}p =(1/2)^n\\ E(2^X)=1+1+1+...+1=inf

0개의 댓글