9강 - 기댓값, 지시확률변수와 선형성

MostlyFor·2023년 1월 9일
0

확률론

목록 보기
8/20

해당 내용은 아래 강좌를 정리한 내용입니다.
https://www.edwith.org/ai152

학습목표

누적분포함수를 이용하여 특정 사건의 확률과 기댓값을 구하는 방법을 알고, 지시확률변수 및 선형성을 이용하여 기댓값을 구할 수 있다.

핵심 키워드

  • 누적분포함수(CDF)
  • 독립 확률변수
  • 기댓값(expectation)
  • 지시확률변수
  • 선형성(linearity)
  • 기하분포

누적분포함수(CDF)를 알고 있다면 확률질량함수(PDF)를 구할 수 있음. 또한 구간에 대한 확률을 구할 수 있음.

CDF의 특징

  1. 증가함수
  2. 우연속함수
  3. f(x) → 0 | x→ 0 f(x)→1|x→ in

확률변수의 독립성

확률변수 X,Y가 독립이라면 (이 뜻은 X, Y가 지칭하는 사건들이 독립)

P(X<x,Y<y)=P(X<x)P(Y<y)P(X<x,Y<y)=P(X<x)P(Y<y)

Expactation

기댓값을 구하는 2가지 방법

  1. 그냥 더한 후 전체 개수로 나눈다 (이땐 모든 수가 같은 가중치를 가진다고 생각할 수 있으므로 가중 평균이 아님
  2. 가중치를 이용하여 가중 평균을 구한다 (이때 가중치는 그 숫자의 개수/ 전체 개수)
E(X)=xP(X=x)E(X)=\sum xP(X=x)

위는 2번 방법을 이용한 것! x는 숫자고 p는 가중치임.

문제 , 기댓값과 베르누이, 이항분포와 기댓값

X ~ bern(p) | X가 베르누이 분포일 때

지시 확률 변수란 사건(A)이 일어나면 1 그렇지 않으면 0을 부여하는 확률변수 (베르누이와 같음)

이때 기댓값은 E(X) = 1 x P(A) + 0 x P(0) = P(A) =p

선형성을 이용하여 이항분포의 기댓값을 쉽게 계산할 수 있음.

E(X+Y)=E(X)+E(Y)E(X+Y)=E(X)+E(Y)

X~bin(n,p)

X=X1+X2+...+XnX=X_1+X_2+...+X_n 이고 각 확률변수는 베르누이 분포를 따른다. 즉, 기댓값은 np

음과 같이 지시확률변수를 이용하여 p로 기댓값을 가지는 여러 사건으로 쪼개서 선형성을 이용하여 각각을 계산하고 더하는 경우가 꽤나 있음.

기하분포 (k=0부터 시작하는 것)

Geo(p) : i.i.d, Bern(p) trials 에서 첫 번째 성공 전의 실패 횟수

PMF:P(X=k)=qkpPMF: P(X=k)=q^kp | 단, k의 범위는 무한대임.

기하분포의 기댓값

E(X)=kkqkpE(X)=\sum_k kq^kp

X = k 일 확률은 실패를 k번하고 k+1번째에 성공하는 확률임.

Story proof

: C가 X의 기댓값이라고 하자

앞면이 나올 확률이 p인 동전을 계속해서 던져서 실패할 기댓값을 구하려고 한다고 해보자.

C는 앞면이 최초로 몇번째에 나올까?

C = 앞면이 바로 나올 확률 (X=0) + 앞면이 두번에 나올 확률 (X=1) + 앞면이 세번에 나올 확률 * (X=2)

=p 0 + qp 1 + q^2p 2 ... =앞면이 바로 나올 확률 (X=0) + 1번실패할확률(1번 실패했다 치고 이제부터 다시하면 언제 최초로 앞면이 나올까?)= p * 0 + q(1+C)

0개의 댓글