Confidence Intervals

김짝뚜·2023년 10월 1일

Mathematical Statistics

목록 보기
2/6

모수 θ\thetaθ^=θ^(X1,,Xn)\hat \theta = \hat \theta (X_1, \ldots, X_n)으로 추정할 수 있다.
sample을 뽑았을 때, θ^\hat \theta값은 모수의 true value는 아니다. 사실 θ\theta는 연속형 분포를 가질 때, Pθ(θ^=θ)=0\mathbb P_{\theta} (\hat \theta = \theta) = 0 이다.

추정의 오차에 대한 추정치가 필요하다. 즉, θ^\hat \thetaθ\theta와 얼마나 다른가에 대한 측정이 필요하다. 이를 신뢰구간(confidence interval)로 추정해볼 수 있다.

신뢰구간의 정의는 아래와 같다.
X1,X2,,XnX_1, X_2, \ldots, X_n이 pdf f(x;θ)f(x;\theta)인 확률변수 XX의 sample이라 하자. 그리고 0과 1 사이의 어떤 특정한 값인 α\alpha가 있고, 두 통계량을 L=L(X1,X2,,Xn)L=L(X_1, X_2, \ldots, X_n)U=U(X1,X2,,Xn)U=U(X_1, X_2, \ldots, X_n)이라 해보자. 그러면

1α=Pθ[θ(L,U)]1-\alpha = \mathbb P_{\theta} [\theta \in (L,U)]

일 때, 구간 (L,U)(L,U)θ\theta(1α)100%(1-\alpha)100\% confidence interval이라 한다.
즉, θ\theta를 포함하는 구간의 확률이 1α1-\alpha이고, 이를 구간의 confidence coefficient라고 한다.


신뢰구간을 바탕으로 한 efficiency의 측정은 expected length로 한다.
예를 들어보자.
θ\theta에 대한 두 개의 신뢰구간 (L1,U1)(L_1, U_1)(L2,U2)(L_2, U_2)가 있고, 두 신뢰구간의 confidence efficient가 같다고 하자. 그 때,

Eθ(U1L1)Eθ(U2L2)  θΩ\mathbb E_{\theta} (U_1 - L_1 ) \le \mathbb E_{\theta}(U_2 - L_2) \quad \forall \; \theta \in \Omega

이라면 (L2,U2)(L_2, U_2)보다 (L1,U1)(L_1, U_1)이 more efficient 하다.
다시 말하자면, 신뢰구간의 상한과 하한의 차이에 대한 기댓값이 더 작을수록 efficient하다는 것이다. 신뢰구간의 크기가 작을수록 좋다는 것이다.

profile
안녕하세요

0개의 댓글