Sampling and Statistics

김짝뚜·2023년 10월 1일

Mathematical Statistics

목록 보기
1/6

확률변수 XX의 분포나 모수가 알려지지 않았을 때, 이들에 대한 정보는 XX의 sample로부터 알 수 있다. sample이 실제로 추출되면 그 값들을 x1,x2,,xnx_1, x_2, \ldots, x_n으로 표현하고 이를 sample의 realizations라고 한다.

sample의 정보를 요약하기 위해 sample을 이용한 함수를 사용하게 되는데, 이를 통계량으로 부른다. 정의는 아래와 같다.
X1,X2,,XnX_1, X_2, \ldots, X_n을 확률변수 XX의 sample이라 하고, T=T(X1,X2,,Xn)T=T(X_1, X_2, \ldots, X_n)이 sample로 만든 함수라고 하면 TTstatistic(통계량)이라고 한다.

sample이 뽑히면 ttTT의 realization이라 하고 t=T(x1,x2,,xn)t = T(x_1, x_2, \ldots, x_n)이라 한다. 여기서 마찬가지로 x1,x2,,xnx_1, x_2, \ldots, x_n은 sample의 realization이다.

조금 더 정확하게 하자면, TT는 우리가 찾고자 하는 모수 θ\thetapoint estimator(점 추정량)이라 하고, realization tt는 모수 θ\thetaestimate(추정치)라고 한다.

점 추정량들에는 몇 가지 성질이 있다. 그 중 하나인 불편성에 대해 알아보자.

Unbiasedness(불편성)

정의는 아래와 같다.
X1,X2,,XnX_1, X_2, \ldots, X_n을 pdf f(x;θ)f(x;\theta)를 가지는 확률변수 XX의 sample이라 하고 T=T(X1,X2,,Xn)T=T(X_1, X_2, \ldots, X_n)을 통계량이라고 하자. 이때

E(T)=θ\mathbb E(T) = \theta

를 만족하면 TTθ\thetaunbiased estimator라고 한다.

profile
안녕하세요

0개의 댓글