표본분포

Rapsby·2020년 12월 11일
0

인공지능 수학

목록 보기
13/19

통계적 추론
표본 조사를 통해 모집단에 대한 해석을 진행
전수조사는 실질적으로 불가능한 경우가 많음

표본 조사는 반드시 오차가 발생
적절한 표본 추출 방법 필요
표본과 모집단과의 관계를 이해해야 함

-단순랜덤추출법
-난수표 사용
-랜덤넘버 생성기 사용

표본분포(Sampling Dsitribution)
-통계량의 확률분포

표본평균
모평균을 알아내는데 쓰이는 통계량

표본평균의 분포
x1,x2,,xnx_1, x_2, \dots, x_n
평균 : μ\mu, 분산: σ2\sigma^2
Xˉ\bar{X}~N(μ,σ2n)N(\mu,\frac{\sigma^2}{n})

import numpy as np
xbars = [np.mean(np.random.normal(size = 10)) for i in range(10000)]
print('mean %f, var %f' %(np.mean(xbars), np.var(xbars)))

xbars = [np.mean(np.random.normal(loc=10, scale=3, size=10)) for i in range(10000)]
print('mean %f, var %f' %(np.mean(xbars), np.var(xbars)))
import matplotlib as plt
h = plt.pyplot.hist(xbars, range=(0,10), bins=30)

중심극한정리
모집단에서 추출된 표본의 측정값
n이 충분히 큰 경우 (n30)(n \geq 30),
근사적으로 Xˉ\bar{X}~N(μ,σ2n)N(\mu,\frac{\sigma^2}{n})

import numpy as np
import matplotlib as plt
n = 3
xbars = [np.mean(np.random.rand(n) * 10) for i in range(10000)]
print('mean %f, var %f' %(np.mean(xbars), np.var(xbars)))
h = plt.pyplot.hist(xbars, range=(0,10), bins=100)

import numpy as np
import matplotlib as plt
n = 2
xbars = [np.mean(np.random.exponential(scale=3, size = n)) for i in range(10000)]
print('mean %f, var %f' %(np.mean(xbars), np.var(xbars)))
h = plt.pyplot.hist(xbars, range=(0,10), bins=100)
profile
Good Morning

0개의 댓글