해당 내용은 아래 강좌를 정리한 내용입니다.
https://www.edwith.org/ai152
학습목표
기댓값의 선형성을 증명할 수 있으며, 음이항분포와 First Success 분포를 기하확률분포를 통하여 유도할 수 있다.
핵심 키워드
기댓값의 선형성 증명 (이거 조약돌 원리로 증명 하셨는데 굳이 할 필요 없을 것 같음)
확률변수 T = X+Y 라고 할 때 E(T) = E(X)+E(Y) 임을 증명.
→ 사실상 음이항 분포는 이항분포와 크게 관련이 없고 기하분포의 일반화임.
2개의 parameters (r,p)
기하 분포가 베루누이 시행에서 첫번째 성공까지의 실패 횟수에 관련된 분포였다면 이는 r개의 성공을 원하는 경우임.
음이항분포의 PMF :
X ~NegBin(r,p) 독립시행 중 r번째 성공까지의 실패 횟수
예를 들어 , 1001000100001000001 일 경우 X=14인 사건임. 이때 모든 사건은
r번째 성공에서 끝남. 그리고 1 이전의 성공/실패 순서가 바뀐다고 해도 확률은 같음.
음이항분포의 식이 이항정리와 비슷해서 음이항분포라고 불린다고 함.
음이항분포의 expactation
원칙적으로는 다음과 같지만 우리는 직관을 통해서 해결할 수 있음.
음이항분포는 기하분포의 일반화이므로 기하분포를 이용할 예정임. 기하분포는 음이항분포에서 실패횟수(r)=1인 경우다. 이때 기하분포의 기댓값은 q/p였다.
이를 이용하여 식을 전개해보자. with 선형성
X_k : k-1번째에서 k번째 성공 까지의 실패 횟수
X~FS(p) time until by success 첫 번째 성공까지 걸린 시도의 수
기하분포는 실패횟수를 세는 것인데 이건 시도의 수임 따라서 1 차이남.
Let Y = X - 1 이라고 하면 Y~Geom(p)를 따름. 즉, Y 를 이용하여 기댓값을 구하면 됨.
결과는 q/p -1이므로 1/p가 되는데 이는 상당히 직관적임 동전이 앞면이 나올때까지 예상되는 시도 횟수는 당연히 2번임.
→ Expactation of Local maxima
동전의 앞면이 나올 떄까지 동전 던짐. n번째 시도에서 처음으로 앞면이 나오면 2^n 달러를 받게됨. 이때 이 게임을 하기 위해 얼마를 내야 손해를 안볼까?
X ~ 기하분포 ( p ) : 성공이 나올 때 까지의 시도 횟수 + 1
E(X) = 1/p = 2
E(2^X) = ?? 이게 문제에서 묻는 것