Rao-Cramer Lower Bound는 어떤 불편추정치의 분산의 lower bound를 나타낸다.
regularity condition 하에서 MLE(Maximum Likelihood Estimate)의 분산은 이 lower bound로 점근적으로 근사된다.
regularity condition은 다음과 같다.
- (R0) PDF들이 distinct하다. 즉, θ=θ′⇒f(xi;θ)=f(xi;θ′)
- (R1) PDF들은 모든 θ에 대해 공통된 support를 가진다.
- (R2) 어떤 한 점 θ0는 Ω의 내부 점(interior point)이다.
- (R3) PDF f(x;θ)는 θ의 함수로써 2번 미분 가능하다.
- (R4) 적분값 ∫f(x;θ)dx는 θ의 함수로써 2번 미분 가능하다.
조건 (R1)-(R4)는 모수 θ가 f(x;θ)>0인 구간의 endpoint에 있지 않다는 걸 의미하고, θ에 대해서 미분과 적분이 교환 가능하다.
1=∫−∞∞f(x;θ)dx
에서 양변을 θ에 대해 미분하면
0=∫−∞∞∂θ∂f(x;θ)dx
이다. 이 식은 다음과 동일하다.
0=∫−∞∞∂θ∂f(x;θ)f(x;θ)f(x;θ)dx
즉,
0=∫−∞∞∂θ∂logf(x;θ)f(x;θ)dx
이다. 이 식을 기댓값을 이용하여 표현하면
E[∂θ∂logf(X;θ)]=0
따라서 확률변수 ∂θ∂logf(X;θ)의 평균은 0이다.
이 식을 다시 미분하면
0=∫−∞∞∂θ2∂2logf(x;θ)f(x;θ)dx+∫−∞∞∂θ∂logf(x;θ)∂θ∂logf(x;θ)f(x;θ)dx
이다. 여기서 우변을 기댓값으로 표현할 수 있으며 아래와 같다.
∫−∞∞∂θ∂logf(x;θ)∂θ∂logf(x;θ)f(x;θ)dx=E[(∂θ∂logf(X;θ))2]=I(θ)
I(θ)를 Fisher Information이라 부른다.
Fisher Information을 바로 위 식에 대입하면 I(θ)는 또 아래와 같이 계산된다.
−∫−∞∞∂θ2∂2logf(x;θ)f(x;θ)dx=I(θ)=−E[∂θ2∂2logf(X;θ)]
위 식들로 확률변수 ∂θ∂logf(X;θ)의 분산이 Fisher Information이 되는 것을 알 수 있다.
즉,
I(θ)=Var(∂θ∂logf(X;θ))