해당 내용은 아래 강좌를 정리한 내용입니다.
https://www.edwith.org/ai152
학습목표
누적분포함수를 이용하여 특정 사건의 확률과 기댓값을 구하는 방법을 알고, 지시확률변수 및 선형성을 이용하여 기댓값을 구할 수 있다.
핵심 키워드
누적분포함수(CDF)를 알고 있다면 확률질량함수(PDF)를 구할 수 있음. 또한 구간에 대한 확률을 구할 수 있음.
CDF의 특징
확률변수 X,Y가 독립이라면 (이 뜻은 X, Y가 지칭하는 사건들이 독립)
기댓값을 구하는 2가지 방법
위는 2번 방법을 이용한 것! x는 숫자고 p는 가중치임.
X ~ bern(p) | X가 베르누이 분포일 때
지시 확률 변수란 사건(A)이 일어나면 1 그렇지 않으면 0을 부여하는 확률변수 (베르누이와 같음)
이때 기댓값은 E(X) = 1 x P(A) + 0 x P(0) = P(A) =p
선형성을 이용하여 이항분포의 기댓값을 쉽게 계산할 수 있음.
X~bin(n,p)
이고 각 확률변수는 베르누이 분포를 따른다. 즉, 기댓값은 np
음과 같이 지시확률변수를 이용하여 p로 기댓값을 가지는 여러 사건으로 쪼개서 선형성을 이용하여 각각을 계산하고 더하는 경우가 꽤나 있음.
Geo(p) : i.i.d, Bern(p) trials 에서 첫 번째 성공 전의 실패 횟수
| 단, k의 범위는 무한대임.
기하분포의 기댓값
X = k 일 확률은 실패를 k번하고 k+1번째에 성공하는 확률임.
: C가 X의 기댓값이라고 하자
앞면이 나올 확률이 p인 동전을 계속해서 던져서 실패할 기댓값을 구하려고 한다고 해보자.
C는 앞면이 최초로 몇번째에 나올까?
C = 앞면이 바로 나올 확률 (X=0) + 앞면이 두번에 나올 확률 (X=1) + 앞면이 세번에 나올 확률 * (X=2)
=p 0 + qp 1 + q^2p 2 ... =앞면이 바로 나올 확률 (X=0) + 1번실패할확률(1번 실패했다 치고 이제부터 다시하면 언제 최초로 앞면이 나올까?)= p * 0 + q(1+C)