추정

Rapsby·2020년 12월 11일
0

인공지능 수학

목록 보기
14/19

표본평균의 특성

모집단이 정규분포인 경우
표본평균 사용

모평균 추정

점추정
표본평균이 점 추정값이 됨

import numpy as np
samples = [...]
print(np.mean(samples))

구간추정
모평균 μ\mu100(1α)%100(1-\alpha)\% 신뢰구간

(μ(\mu의 추정량)±zα/2)\pm z_{\alpha/2}(추정량의 표준편차)
정규분포에서 σ\sigma를 알 때,
(xˉzα/2,xˉ+zα/2)(\bar{x}- z_{\alpha/2}, \,\,\bar{x} + z_{\alpha/2})
-실용적이지 못 함 : 정규분포가 아니거나 표준편차가 알려져 있지 않음

표본의 크기가 클 때 중심극한정리 사용
(μ(\mu의 추정량)±zα/2)\pm z_{\alpha/2}(추정량의 표준편차)
(xˉzα/2sn,xˉ+zα/2sn)(\bar{x}- z_{\alpha/2}\frac{s}{\sqrt{n}}, \,\,\bar{x} + z_{\alpha/2}\frac{s}{\sqrt{n}})
ss : 표본표준편차

import numpy as np
w = [...]
xbar = np.mean(w)
sd = np.std(w, ddof=1)
print('평균 %.2f, 표준편차 : %.2f' %(xbar, sd))
imprt scipy.stats
alpha = 0.05
zalpha = scipy.stats.norm.ppf(1-alpha/2)
print('zalpha: ', zlapha)

모비율 추정

점 추정
확률변수 XX:
-nn개의 표본에서 특정 속성을 갖는 표본의 개수
모비율 pp의 점추정량
-p^=Xn\hat{p} = \frac{X}{n}

구간추정
n이 충분히 클 때,
np^>5,n(1p^)>5n\hat{p} > 5, n(1-\hat{p})>5일 때를 의미
XX~N(np,np(1p))N(np,np(1-p))

확률변수 XX의 표준화
Z=Xnpnp^(1p^)=p^pp^(1p^)nZ = \cfrac{X-np}{\sqrt{n\hat{p}(1-\hat{p})}} = \cfrac{\hat{p}-p}{\sqrt{\cfrac{\hat{p}(1-\hat{p})}{n}}}
근사적으로 표준정규분포 N(0,1)N(0,1)를 따름

모비율 pp100(1α)100(1-\alpha)% 신뢰구간
(p^zα2p^(1p^)np^+zα2p^(1p^)n)\begin{pmatrix}\hat{p} - z_\frac{\alpha}{2} \sqrt{\cfrac{\hat{p}(1-\hat{p})}{n}} \, \hat{p} + z_\frac{\alpha}{2} \sqrt{\cfrac{\hat{p}(1-\hat{p})}{n}}\end{pmatrix}

import numpy as np
import scipy.stats
x = 48
n = 150
phat = x/n
alpha = 0.05
zalpha = scipy.stats.norm.ppf(1-alpha/2)
sd = np.sqrt(phat*(1-phat)/n)
print('phat %.3f, zalpha: %.3f, sd: %.3f' %(phat, zalpha, sd))
ci = [phat - zalpha * sd, phat + zalpha * sd]
print(ci)
profile
Good Morning

0개의 댓글