Definition
X∼P0∈P={Pθ,θ∈Θ}
- T(X): 통계량
- X∣T(X)의 분포가 θ에 의존하지 않으면, i.e.[X∣T(X)]θ1=[X∣T(X)]θ2,∀θ1=θ2이면
T(X)를 θ에 대한 (P에 대한) 충분통계량이라 한다. ⇒T(X)를 안 상태에서의 X는 θ에 대한 정보를 갖고 있지 않다. ⇒ 원래 X가 갖고 있던 정보는 T(X)가 갖고 있음.
Lemma.
T(X):θ에 대한 SS.
T(X)의 1-1 함수 역시 θ에 대한 SS.
Sufficiency Principle (충분성 원칙)
T(X)가 θ의 SS이면, 관측치 X를 이용한 θ에 대한 추론은 T(X)를 통해서만 X에 의존해야 한다.
i.e.,x와 y가 T(x)=T(y)를 만족하면 x를 이용한 θ의 추론과 y를 이용한 θ의 추론이 동일해야 한다.
Factorization Theorem (분해 정리)
X∼P0,θ∈Θ. T가 θ∈Θ에 대한 SS일 필요충분조건은
Pθ(x)=g(T(x),θ)⋅h(x),∀x∈X,θ∈Θ
를 만족하는 음이 아닌 값을 갖는 함수 g(t,θ)와 h(x)가 존재.
Proof.
X가 이산형이라고 가정하고 증명해보자.
김우철 수리통계학 참고
Sufficiency와 Decision Theory
Theorem.
X∼Pθ,θ∈Θ,T(X) 는 θ 의 SS.
δ(X,⋅) 가 랜덤화된 결정규칙이라면,
R(θ,δ)=R(θ,δ∗),∀θ.i.e. 평가 입장에서 동일.
를 만족하는 SS T에만 의존하는 결정규칙 δ∗(T,da)가 존재한다.
cf) θ에 대한 추론을 할 때, SS만 고려하면 된다. Rao-blackwell theorem과는 다르다.
Proof.
R(θ,δ)∴∃δ∗(t,da).=Eθ[L(θ,δ(X,⋅)]=∫X∫AL(θ,a)δ(x,da)Pθ(dx),X:Sample space,A:Action space=∫T∫X∫AL(θ,a)δ(x,da)PX∣T(dx)⋅PθT(dt)=∫T∫AL(θ,a)∫Xδ(x,da)PX∣T(dx)⋅PθT(dt)=∫T∫AL(θ,a)⋅δ∗(t,da)PθT(dt)=R(θ,δ∗)
Example.
X1,…,Xn∼iidN(θ,1)
- Xˉ:θ에 대한 SS.
- Loss: L(θ,δ)=(θ−δ)2
- 추정량: δ(X1,…,Xn)=X1
SS의 함수이면서 δ와 위험함수가 동일한 랜덤화된 결정규칙을 구하라.
Rao-Blackwell Theorem
Theorem.
X∼Pθ∈P={Pθ,θ∈Θ}
T=T(X): θ의 SS.
u=u(X): θ의 추정량.
Then,
1. ϕ(T)=Eθ[u∣T] 는 θ에 의존하지 않는 추정량 (T가 SS가 아니면 추정량으로 사용 불가. 보통 조건부가 θ에 의존하기에.)
2. L(θ,a)가 a에 대한 convex function이면, Eθ[L(θ,u(X))]≥Eθ[L(θ,ϕ(T))],∀θ.
3. Eθ[{η(θ)−u(X)}2]≥Eθ[{η(θ)−ϕ(T)}2],∀θ. (2.의 특별한 경우. loss가 MSE일 때.)
Minimal Sufficiency (최소충분성)
Def. Minimal Sufficiency
X∼Pθ,θ∈Θ
통계량 T(X)가 다음의 두 조건을 만족하면 θ의 최소충분통계량(Minimal Sufficient Statistic)이라 한다.
a) T는 θ의 SS.
b) S(X)가 θ의 SS이면, T(X)=g(S(X))를 만족하는 함수 g가 존재.
Likelihood Ratio는 Minimal Sufficient Statistic.
f(x;θ),θ∈Θ; X의 밀도함수.
x,y∈X에 대해,
f(y;θ)f(x;θ)=θ 에 관해 상수 ⟺ T(x)=T(y) 를 만족하면, T(X)는 θ의 MSS.
i.e. Likelihood ratio가 같으면 하나의 T값을 갖는다. x와 y는 동일한 likelihood function을 갖는다.
Proof.
f(x;θ)>0,∀x,θ 를 가정하자.
a) T가 θ의 SS임을 보이자.
- Y= T의 공변역 (T값들의 모임)
- At:={x∈X:T(x)=t},t∈Y.
- xt:At 의 대표값.
- xT(x):x 가 포함된 At의 대표값.
가정에 의해, f(xT(x);θ)f(x;θ):θ 에 의존하지 X.
f(x;θ)=f(xT(x);θ)f(x;θ)⋅f(xT(x);θ)
따라서, Factorization theorem에 의해 T는 θ의 SS.
b) S(x):θ의 SS라 하자.
S(x)=S(y)⇒T(x)=T(y)를 보이고자.
By factorization theorem,
f(x;θ)=g(s(x);θ)⋅h(x) 를 만족하는 양의 값을 갖는 g,h 존재.
S(x)=S(y)인 x,y 에 대해
f(y;θ)f(x;θ)=g(s(y);θ)⋅h(y)g(s(x);θ)⋅h(x)=h(y)h(x);θ에 의존 X.
가정에 의해, T(x)=T(y).
Likelihood Principle (가능도 원칙)
Likelihood Principle을 믿으면 likelihood가 같을 때 모든 추정량이 같음. 여기서, Likelihood가 같다는 의미는 상수배만 같아도 됨. θ 에 의존하지만 않으면 됨.
- f(y;θ)f(x;θ)=h(x,y) 이라면 x와 y는 같은 likelihood function을 갖는다.
- 동일한 likelihood function을 갖는 x들의 T값이 하나의 값을 가질 때 T는 MSS.
Example. 정규모형
X1,…,Xn∼N(θ,σ2),θ∈R,σ2>0.
{x=(x1,…,xn)y=(y1,…,yn) (θ,σ2)의 MSS?
Sol)
f(y;θ,σ2)f(x;θ,σ2)=σn(2π)n/21exp[−2σ21{Σ(yi−yˉ)2+n(yˉ−θ)2}]σn(2π)n/21exp[−2σ21{Σ(xi−xˉ)2+n(xˉ−θ)2}]:(θ,σ2) 가 상수. ⟺xˉ=yˉ,Σ(xi−xˉ)2=Σ(yi−yˉ)2.
따라서, (Xˉ,Σ(Xi−Xˉ)2);(θ,σ2) 의 MSS.