중심극한정리 가볍게 핥기

Kiwoong Park·2022년 2월 7일
1

중심극한정리(Central Limit Theorem)

모집단이 정규분포가 아니더라도, 표본의 크기 n이 충분히 크고 데이터가 정규성을 크게 이탈하지 않는 경우, 여러 표본에서 추출한 표본의 평균의 분포는 정규분포를 따른다.

수식으로 표현하자면,

평균 μ\mu, 분산 σ2\sigma^2인 임의의 모집단에서 크기가 n인 표본 {x1,x2,...,xn}\{x_1, x_2, ..., x_n\}에서 표본들의 평균 xˉ\bar{x}의 분포는 nn\rarr\infin일 때(충분히 클 때), N(μ,σ2n)N(\mu, \cfrac{\sigma^2}{n})에 근사한다.

예를 들어 설명하보자면,

어떤 회사에서 생산하는 전자제품의 수명이 평균 730일, 표준편차가 60일인 어떤 확률분포를 따른다고 하자.
이 전자제품 100개의 표본에 대해 평균수명이 720일에서 735일 사이에 있을 확률은 얼마일까?

이문제에서 중요한 것은 전자제품의 수명이 어떤 확률분포를 따르는지 알 수 없음에도 불구하고, 표본 100개는 충분히 크다고 볼 수 있으므로 이 전자제품의 수명의 표본의 평균의 확률분포는 정규분포에 근사한다고 할 수 있다.

즉, 중심극한정리에 의해 표본평균 xˉ\bar{x}
근사적으로 정규분포 N(730,602100)N(730일, \cfrac{60일^2}{100})을 따른다.
P(720<xˉ<735)=P(7207306010Z7357306010)=P(1.666Z0.8333)=0.7499=75%P(720일<\bar{x}<735일) = P(\cfrac{720-730}{\cfrac{60}{10}} \leq Z \leq \cfrac{735-730}{\cfrac{60}{10}}) = P(-1.666\leq Z \leq 0.8333) = 0.7499=75\%

참조 유튜브 강의

profile
You matter, never give up

0개의 댓글