표본평균의 특성
모집단이 정규분포인 경우
표본평균 사용
모평균 추정
점추정
표본평균이 점 추정값이 됨
import numpy as np
samples = [...]
print(np.mean(samples))
구간추정
모평균 μ의 100(1−α)% 신뢰구간
(μ의 추정량)±zα/2(추정량의 표준편차)
정규분포에서 σ를 알 때,
(xˉ−zα/2,xˉ+zα/2)
-실용적이지 못 함 : 정규분포가 아니거나 표준편차가 알려져 있지 않음
표본의 크기가 클 때 중심극한정리 사용
(μ의 추정량)±zα/2(추정량의 표준편차)
(xˉ−zα/2ns,xˉ+zα/2ns)
s : 표본표준편차
import numpy as np
w = [...]
xbar = np.mean(w)
sd = np.std(w, ddof=1)
print('평균 %.2f, 표준편차 : %.2f' %(xbar, sd))
imprt scipy.stats
alpha = 0.05
zalpha = scipy.stats.norm.ppf(1-alpha/2)
print('zalpha: ', zlapha)
모비율 추정
점 추정
확률변수 X:
-n개의 표본에서 특정 속성을 갖는 표본의 개수
모비율 p의 점추정량
-p^=nX
구간추정
n이 충분히 클 때,
np^>5,n(1−p^)>5일 때를 의미
X~N(np,np(1−p))
확률변수 X의 표준화
Z=np^(1−p^)X−np=np^(1−p^)p^−p
근사적으로 표준정규분포 N(0,1)를 따름
모비율 p의 100(1−α) 신뢰구간
(p^−z2αnp^(1−p^)p^+z2αnp^(1−p^))
import numpy as np
import scipy.stats
x = 48
n = 150
phat = x/n
alpha = 0.05
zalpha = scipy.stats.norm.ppf(1-alpha/2)
sd = np.sqrt(phat*(1-phat)/n)
print('phat %.3f, zalpha: %.3f, sd: %.3f' %(phat, zalpha, sd))
ci = [phat - zalpha * sd, phat + zalpha * sd]
print(ci)