통계적 추론
표본 조사를 통해 모집단에 대한 해석을 진행
전수조사는 실질적으로 불가능한 경우가 많음표본 조사는 반드시 오차가 발생
적절한 표본 추출 방법 필요
표본과 모집단과의 관계를 이해해야 함-단순랜덤추출법
-난수표 사용
-랜덤넘버 생성기 사용표본분포(Sampling Dsitribution)
-통계량의 확률분포표본평균
모평균을 알아내는데 쓰이는 통계량표본평균의 분포
평균 : , 분산:
~import numpy as np xbars = [np.mean(np.random.normal(size = 10)) for i in range(10000)] print('mean %f, var %f' %(np.mean(xbars), np.var(xbars))) xbars = [np.mean(np.random.normal(loc=10, scale=3, size=10)) for i in range(10000)] print('mean %f, var %f' %(np.mean(xbars), np.var(xbars))) import matplotlib as plt h = plt.pyplot.hist(xbars, range=(0,10), bins=30)
중심극한정리
모집단에서 추출된 표본의 측정값
n이 충분히 큰 경우 ,
근사적으로 ~import numpy as np import matplotlib as plt n = 3 xbars = [np.mean(np.random.rand(n) * 10) for i in range(10000)] print('mean %f, var %f' %(np.mean(xbars), np.var(xbars))) h = plt.pyplot.hist(xbars, range=(0,10), bins=100) import numpy as np import matplotlib as plt n = 2 xbars = [np.mean(np.random.exponential(scale=3, size = n)) for i in range(10000)] print('mean %f, var %f' %(np.mean(xbars), np.var(xbars))) h = plt.pyplot.hist(xbars, range=(0,10), bins=100)