8.2 베르누이분포와 이항분포(정리중)

TonyHan·2020년 10월 27일
0

기초통계학

목록 보기
8/8

베르누이 분포

베르누이 시행

결과가 두 가지 중 하나로만 나오는 실험이나 시행을 베르누이 시행이라고 부른다.

베르누이 확률

베르누이 시행으로 나온 값들의 확률을 베르누이 확률이라고 부른다.

베르누이 확률분포


물결무니는 이러한 확률분포를 따른다는 의미, Bern는 베르누이 확률분포를 의미, x는 x 라는 값을 출력한다. 그리고 μ는 내부 확률분포의 모양을 결정하는 모수 파라미터가 μ라는 것을 의미한다.


그래서 수식은 위와 같이 결정되게 된다. 이때 베르누이는 확률질량함수이다.

그리고 이러한 수식을 간단하게 만들어 보면

위와 같이 만들어지게 된다. 이 수식은 x가 0과 1만을 고를 수 있다. 그 결과물은 넣어보면 알겠지만 위에 위에 있던 것과 동일하게 나오는 것을 확인할 수 있다.

이제 좀 특별한 경우에는 1과 -1 로 표현하는데 이때는 아래와 같은 수식으로 사용한다.

사이파이를 사용한 베르누이 확률변수의 시뮬레이션

mu=0.6
rv=sp.stats.bernoulli(mu)

위와 같이 bernoulli 클래스 객체를 만들 수 있다.
그리고 모델에는 오로직 pmf 확률질량함수만 존재한다.


그래서 이걸로 bar로 표현해보면 위와 같이 생성된다.

이것의 랜덤한 표본값을 뽑아내 보자

x=rv.rvs(100,random_state=0)
x

과연 이때 숫자 100은 무엇일까? 왜냐하면 다른 모델에서는 100번 표본을 뽑아낸 것이지만 여기에서는 그게 아니니까 말이다. 정답은 시행의 횟수이다. 이건 100번의 시행에서 랜덤으로 0또는 1을 반환하여 준다.


그래서 데이터를 countplot으로 표현하면 위와 같이 표현된다.

y = np.bincount(x, minlength=2) / float(len(x))
df = pd.DataFrame({"이론": rv.pmf(xx), "시뮬레이션": y})
df.index = [0, 1]
df2 = df.stack().reset_index()
df2.columns = ["표본값", "유형", "비율"]


그래서 위에서 나온 것과 이론적인 출력의 결과를 비교해보면 위와 같은 차이가 남을 확인할 수 있다.

베르누이분포의 모멘트

모멘트는 어떠한 분포의 특성을 나타내는 값을 의미한다.

  • 기댓값

    -분산

그래서 앞에서 다루었던 베르누이 분포의 평균과 표준편차를 구해보면
E[X]=0.6
Var[X]=0.24

이걸 한번 실재 코드로 구현하여 보자

이번에 var의 ddof(degree of freedom)을 1로 주어 비편향 표준편차로 만들어 주었는데 우리가 예측한 결과하고 유사한 것을 확인할 수 있다.

하지만 실재로 이를 구할때는 scipy의 describe 함수를 사용하자

이항분포

성공한 횟수를 계산하는 분포

이제 베르누이분포에서 횟수를 추가적 계산하여 N번의 시행중 성공한 횟수를 확률변수 X라고 한다면 X의 값은 0부터 N까지의 정수 중 하나가 될 것이다.

그래서 수식은 위와 같이 N번 시행중 x번 되었다는 의미에서 조합을 사용한다.

사이파이를 이용한 이항분포의 시뮬레이션

그렇다면 모수가 0.6인 동전을 10번던지는 시행을 반복해서 하였을때 가장 성공한 횟수들을 계산하여 보면 아래와 같은 그래프가 생기게 된다.

결국 10번 던지어서 6번정도 성공할 가능성이 가장 높다는 것을 그래프를 통해서 확인할 수 있다.

이러한 0.6의 성공확률을 가진 동전을 10번 던지는 시행을 100번 하여서 랜덤 값들을 뽑아보면

위와 같이 값들이 출력된 것을 확인할 수 있고 이것을 그래프(countplot)으로 그려보면

위와 같이 표현되는 것을 확인할 수 있다.

이항분포의 모멘트

  • 평균

  • 분산

평균과 분산이 베르누이 값에 N만 곱한것을 확인할 수 있다.

베르누이분포와 이항분포의 모수추정

이제 모집단의 모평균을 찾아내는 모수추정을 해보자(parameter estimation)

모수를 추정하는 방법은 총 던진횟수 N분에 1이 나온횟수로 나누면 된다.

베르누이분포의 활용

그럼 이렇게 나온 값을 어디다 쓰는가?

profile
예술가

0개의 댓글

관련 채용 정보