정보부등식 Information Inequality
- 조건
- 확률밀도함수 f(x;θ)와 통계량 T(X) 에 대해 다음과 같은 가정을 한다
1. 모수가 다르면 확률밀도함수가 다르다 θ=θ′ 라면 f(x;θ)=f(x;θ′)
2. 집합 A={x:f(x;θ)>0} 는 모수 θ에 의존하지 않으며, 모든 x∈A θ∈Ω 에 대하여 logf(x;θ) 는 θ 에 대해 두번 미분가능하고 도함수가 연속이다
3. 통계량 T(X) 가 모든 θ∈Ω 에 대하여 E[T(X)]<∞ 이면
- ∂θ∂∫⋯∫T(x1,x2,⋯,xn)i=1∏nf(xi;θ)dx1dx2⋯dxn=∫⋯∫∂θ∂i=1∏nf(xi;θ)dx1dx2⋯dxn
- 모든 θ∈Ω 에 대하여 Var(T(X))<∞,E[T(X)]=g(θ),0<I(θ)<∞
- 정리
- Var(T(X))≥nI(θ)[g′(θ)]2 이다
- 증명
- T(X)=T(X1,X2,⋯,Xn) 은 g(θ) 에 대한 불편추정량이므로, T(X) 에 대한 기댓값이 g(θ) 이다
- g′(θ)=∂θ∂g(θ)=∂θ∂∫⋯∫−∞∞T(x1,x2,⋯,xn)i=1∏nf(xi;θ)dx1dx2⋯dxn
- =∫⋯∫−∞∞T(x1,x2,⋯,xn)∂θ∂[i=1∏nf(xi;θ)]dx1dx2⋯dxn
- ∂θ∂∫⋯∫i=1∏nf(xi;θ)dx1dx2⋯dxn=∂θ∂(1)=0 이라는 사실을 활용하자
- g(θ)∂θ∂∫⋯∫−∞∞i=1∏nf(xi;θ)dx1dx2⋯dxn=g(θ)∫⋯∫−∞∞∂θ∂[i=1∏nf(xi;θ)]dx1dx2⋯dxn=0
- =∫⋯∫−∞∞[T(x1,x2,⋯,xn)−g(θ)]∂θ∂[i=1∏nf(xi;θ)]dx1⋯dxn
- =∫∫−∞∞[T(x1,x2,⋯,xn)−g(θ)][∂θ∂log(i=1∏nf(xi;θ))]⋅i=1∏nf(xi;θ)dx1dx2⋯dxn
- =E[(T(X)−g(θ))∂θ∂(log(i=1∏nf(Xi;θ))]
- [g′(θ)]2≤E[((T(X)−g(θ)2)]⋅E[(∂θ∂(log(i=1∏nf(Xi;θ)))2]
- [g′(θ)]2≤Var(T(X))⋅E[(∂θ∂(log(i=1∏nf(Xi;θ)))2]
- Var(T(X))≥E[(∂θ∂(log(i=1∏nf(Xi;θ)))2][g′(θ)]2
- 그런데 ∂θ∂log(f(Xi;θ))=∫−∞∞[∂θ∂logf(x;θ)]f(x;θ)
- =∫−∞∞∂θ∂f(x;θ)dx=∂θ∂∫−∞∞f(x;θ)dx=0 이므로
- E[(∂θ∂log(i=1∏nfi(xi;θ)))2]=E[(i=1∑n∂θ∂logf(Xi;θ))2]=i=1∑nj=1∑nE[(∂θ∂f(Xi;θ))(∂θ∂log(f(Xj;θ)))]
- 여기서 마지막 항의 두 곱은 독립이므로 E(X1X2)=E(X1)E(X2) 의 조건을 사용할 수 있다. 이 사실을 활용하면 i=j 외의 다른 곱의 조합에선 모두 0이 됨을 알 수 있고
- =nE[(∂θ∂log(f(X;θ)))2] 이다. 이 값은 피셔의 정보의 정의 I 에다 n 을 곱한 값이므로
- Var(T(X))≥nI[g′(θ)]2 ,I=E[(∂θ∂log(f(X;θ)))2]