모수 θ는 θ^=θ^(X1,…,Xn)으로 추정할 수 있다.
sample을 뽑았을 때, θ^값은 모수의 true value는 아니다. 사실 θ는 연속형 분포를 가질 때, Pθ(θ^=θ)=0 이다.
추정의 오차에 대한 추정치가 필요하다. 즉, θ^가 θ와 얼마나 다른가에 대한 측정이 필요하다. 이를 신뢰구간(confidence interval)로 추정해볼 수 있다.
신뢰구간의 정의는 아래와 같다.
X1,X2,…,Xn이 pdf f(x;θ)인 확률변수 X의 sample이라 하자. 그리고 0과 1 사이의 어떤 특정한 값인 α가 있고, 두 통계량을 L=L(X1,X2,…,Xn)과 U=U(X1,X2,…,Xn)이라 해보자. 그러면
1−α=Pθ[θ∈(L,U)]
일 때, 구간 (L,U)를 θ의 (1−α)100% confidence interval이라 한다.
즉, θ를 포함하는 구간의 확률이 1−α이고, 이를 구간의 confidence coefficient라고 한다.
신뢰구간을 바탕으로 한 efficiency의 측정은 expected length로 한다.
예를 들어보자.
θ에 대한 두 개의 신뢰구간 (L1,U1)과 (L2,U2)가 있고, 두 신뢰구간의 confidence efficient가 같다고 하자. 그 때,
Eθ(U1−L1)≤Eθ(U2−L2)∀θ∈Ω
이라면 (L2,U2)보다 (L1,U1)이 more efficient 하다.
다시 말하자면, 신뢰구간의 상한과 하한의 차이에 대한 기댓값이 더 작을수록 efficient하다는 것이다. 신뢰구간의 크기가 작을수록 좋다는 것이다.