정칙조건
정칙조건은 이론/논리적 전개의 용이성을 위해 가정하는 조건들을 의미한다.
-
확률 함수들은 θ에 대해 단사다. 즉 θ=θ′이면 f(xi;θ)=f(xi;θ′)이다.
-
확률 함수들은 가능한 모든 θ에 대해 동일한 서포트를 가진다.
-
실제 모수 값 θ0는 모수 공간 Ω의 interior point다. 따라서 어떤 양수 ϵ이 존재해서 (θ0−ϵ,θ0+ϵ)⊂Ω를 만족한다.
최대 우도 추정량의 점근적 수렴
우리는 표본이 점점 커질수록 모집단과 성질이 비슷해질 것을 기대한다.
최대 우도 추정법에 이 가정을 적용시키면 표본이 점점 커질수록 실제 모수에서의 우도 함수 값이 다른 모수를 가정했을 때의 우도 함수 값보다 클 것을 기대할 수 있다. 그래야 실제 모수의 우도 함수 값이 최댓값이 되어 올바른 모수 추정이 가능하기 때문이다.
이 성질을 수식으로 나타내면 다음과 같다.
n→∞limPθ0[L(θ0)>L(θ)]=1,∀θ=θ0
이는 표본이 커질수록 실제 모수의 분포 하에서 L(θ0)>L(θ)의 사건이 벌어질 확률은 1로 수렴할 것을 의미한다. 따라서 표본 크기가 매우 커지면 위에서 기대했던 실제 모수에서의 우도 함수 값이 다른 가정된 모수에서의 우도 함수 값보다 거의 항상 클 것을 기대할 수 있다.
증명)
L(θ0)>L(θ)⇔L(θ0)L(θ)<1⇔log[L(θ0)L(θ)]<0⇔l(θ)−l(θ0)<0⇔i=1∑n[logf(xi;θ)−logf(xi;θ0)]<0⇔Let Zi=log(f(xi;θ0)f(xi;θ)),Zˉ=n1i=1∑n[log(f(xi;θ0)f(xi;θ))]<0By WLLM, Zˉ→PEθ0(Z1) (1)Eθ0(Z1)=Eθ0[log(f(x1;θ0)f(x1;θ))]<log[Eθ0(f(x1;θ0)f(x1;θ))] (∵젠센 부등식)=log(∫f(x1;θ0)f(x1;θ)f(x1;θ0)dθ)=log1=0∴Zˉ→PEθ0(Z1)<0⇒n→∞limPθ0[Zˉ<0]=n→∞limPθ0[L(θ0)>L(θ)]=1
최대 우도 추정량의 불변성(Invariance property)
함수 g:Ω→Λ가 역함수가 존재하는 전단사 함수라고 하자.
θ^n이 모수 θ에 대한 MLE라면, g(θ^n)은 모수 g(θ)에 대한 MLE다.
증명)
ϕ=g(θ)라고 하자. g가 일대일 대응이기 때문에 모든 ϕ에 대해 어떤 θ가 유일하게 존재해 θ=g−1(ϕ)를 만족한다.
우리가 찾으려고 하는 것은 ϕ의 우도 함수를 최대로 만드는 ϕ^=g(θ)^를 찾는 것이다.
ϕ의 우도 함수를 L′(ϕ;x)=L(g−1(ϕ);x)로 정의하자.
그렇다면 ϕ의 MLE는 ϕ^n=argmaxϕL′(ϕ;x)=argmaxϕL(g−1(ϕ);x)가 된다.
따라서 ϕ^n은 어떤 θ=g−1(ϕ)가 L을 최대화 할 때의 ϕ값이므로, θ^n=g−1(ϕ^)⇒ϕ^n=g(θ^n)임을 알 수 있다.
최대 우도 추정량의 일관성(Consistency)
최대 우도 추정량은 consistent estimator다. 즉 θn^이 실제 모수 θ0의 최대 우도 추정량이면 일관성의 정의에 따라 θn^은 θ0으로 확률 수렴한다.
증명 스케치)
θ0는 모수 공간 Ω의 내부점이다. 따라서 어떤 ϵ>0가 존재해서 (θ0−ϵ,θ0+ϵ)⊂Ω를 만족한다.
사건 Sn = {X∣l(θ0)>l(θ−ϵ)}∩{X∣l(θ0)>l(θ0+ϵ)}으로 정의하자. Sn은 θ0에서의 우도 함수의 값이 근방의 우도 함수 값보다 큰 사건을 의미한다.
위에서 살펴본 추정량의 점근적 수렴 성질에 따라 사건 Sn의 모수가 θ0인 분포에서의 확률, 즉 P(Sn)은 점근적으로 1에 수렴한다. 따라서 n→∞limP(Sn)=1이다.
θn^이 ∣θn^−θ0^∣<ϵ이고 l′(θn^)=0을 만족하는 극대점에서의 θ값이라고 하자.
Sn은 θ−ϵ과 θ+ϵ 사이에 극대점이 있을 것을 보장한다.
따라서 Sn⊂{X∣∣θn^−θ0^∣<ϵ,l′(θn^)=0}이므로 P(Sn)≤P({X∣∣θn^−θ0^∣<ϵ,l′(θn^)=0})이다.
이 때 P(Sn)→1이므로 n→∞limP({X∣∣θn^−θ0^∣<ϵ,l′(θn^)=0})=1이다. 따라서 θn^→Pθ0이다.
이런 유용한 정보를 나눠주셔서 감사합니다.