4.5 일치추정량
정의 4.9
모수의 함수 g(θ)의 추정량 Tn(X)=T(X1,X2,…,Xn)이 임의의 ϵ>0에 대하여
n→∞limP(∣Tn(X)−g(θ)∣≤ϵ)=1
을 만족하면 추정량 Tn(X)는 일치성이 있다고 한다.
예 4.40
X1,X1,…,Xn을 U(0,θ)로부터 얻은 랜덤표본이라고 하자. 이때 최대 가능도 추정량은
X(n)=θnn(x(n))n−1
이다. 이제 모수 θ의 추정량 X(n)의 일치성에 대해 확인. 임의의 ϵ>0에 대하여
P(∣X(n)−θ∣≤ϵ)=P(θ−ϵ≤X(n)≤θ)=∫θ−ϵθθnn(x(n))n−1 dx(n)=θn(x(n))n∣∣∣∣∣θ−ϵθ=1−[θθ−ϵ]n
이 성립한다. 0<ϵ<θ이면 n이 커질 때
[θθ−ϵ]n→0
이므로 P(∣X(n)−θ∣≤ϵ)→1이 되고 ϵ≥θ이면 모든 n에 대해 P(∣X(n)−θ∣≤ϵ)=1이 되므로 표본최댓값 X(n)은 θ의 일치추정량이다.
정리 4.9
추정량이 일치성을 가질 조건을 평균제곱오차(MSE)를 이용하여 표현할 경우, Tn(X)를 g(θ)의 추정량이라고 할 때, 모든 θ∈Ω에 대하여
n→∞limE[Tn(X)−g(θ)]2=0
이 성립하면, Tn(X)는 일치성이 있다.
[증명]
확률부등식에 의하면 X=Tn(X)−g(θ), r=2, c=ϵ으로 놓을 때 (쳬비셰프 부등식)
P[∣Tn(X)−g(θ)∣≤ϵ]≥1−ϵ2E[Tn(X)−g(θ)]2
이 성립한다. 이 때 좌변이 1이 성립할 때 일치성을 만족하기 때문에 E[Tn(X)−g(θ)]2=0인 경우 일치성이 성립한다.
⋇ MSE(Tn)=E[Tn(X)−g(θ)]2=Var(Tn)+[E(Tn)−g(θ)]2이므로 Tn이 g(θ)의 비편향추정량 [E(Tn)−g(θ)]=0인 경우 맨 오른쪽 항이 0이므로 limn→∞Var(Tn)=0이 성립하면 정리 4.9로부터 추정량 Tn의 일치성이 보장된다.
예 4.41
X1,X2,…,Xn을 EXP(λ)로부터 얻은 랜덤표본이라고 하자. 이때 최대가능도 추정량 Xˉn은 비편향추정량이며
MSE(Xˉn)=Var(Xˉn)=0
이므로 Xˉn는 일치추정량이다.
한편 nX(1)∼EXP(λ)이므로 nX(1)은 λ의 비편향추정량이다. 하지만 ϵ<λ인 ϵ>0에 대해
P[∣nX(1)−λ∣≤ϵ]=e−1(eϵ/λ−e−ϵ/λ)
로 n이 커질 때 1로 수렴하지 않으므로 일치추정량이 아니다.
정리 4. 10
Tn이 모수 θ의 일치추정량이라고 할 때 g(x)가 θ에서 연속인 함수이면 g(Tn)은 g(θ)의 일치추정량이다.
정리 4. 11
Tn이 모수 θ1의 일치추정량이고 Sn이 모수 θ2의 일치추정량이라고 하자. 그러면 cn→c이고 dn→d 인 실수열 cn, dn에 대해,
cnTn+dnSnpcθ1+dθ2
이고,
Tn/Snpθ1/θ2,TnSnpθ1θ2 (θ2=0)
예 4.42
예 4.43
최대가능도 추정량의 점근적 성질
직접적으로 일치성을 입증하기 어려운 경우 적절한 조건하에서 점근적 성질을 이용한다면 최대가능도 추정량은 일치성을 가질 뿐 아니라 점근적으로 정규분포를 따르기 때문에 쉽게 근사적 구간추정과 검정이 가능하다.
정리 4.12
X1,X2,…,Xn이 확률밀도함수 f(x;θ)를 갖는 랜덤표본일 때 적절한 조건하에서 최대가능도 추정량 θ^n은 θ의 일치추정량이다.
θ^npθ
[풀이]
X1,X2,…,Xn이 확률밀도함수 f(x;θ)를 갖는 확률분포로부터 랜덤표본이고 θ^n이 θ의 최대가능도 추정량이라고 하자. 로그가능도함수 θ에 대한 1차 도함수는 θ^n에서 0이다.
ℓ′(θ)=i=1∑ndθθlog(f(xi;θ)∣∣∣∣∣∣θ=θ^=0
그리고 로그 가능도함수의 1차 도함수는 대수의 법칙에 의해 다음이 성립한다.
n1i=1∑ndθdlog f(xi;θ)pE(dθdlog f(X;θ))
이 때 양변을 0으로 하는 해는 각각 최대가능도 추정량 θ^n과 모수의 참값인 θ0이다(1). 따라서 적절한 조건에서
θ^npθ0
으로 수렴할 것으로 기대할 수 있다. 참고서적의 수준에서 적절한 조건은 θ에 대해 여러 번 미분 가능한 경우로 충분하다고 정의했다.
정리 4.13
X1,X2,…,Xn이 확률밀도함수 f(x;θ)를 갖는 랜덤표본이고 모수의 참값인 θ0일 때 적절한 조건하에서 최대가능도 추정량 θ^n는 점근적으로 정규분포를 따른다.
n(θ^n−θ0)dN(0, I(θ0)1)
[풀이]
가능도함수 L(θ)는 Xi들의 함수로서 그 자체가 확률변수이므로
ℓ(θ)=logL(θ)=i=1∑nlog f(Xi;θ)
는 서로 독립이고 분포가 같은 n개의 확률변수의 합으로 표현 가능하다. 모수의 참값이 θ0일 때, 로그가능도함수를 미분한 ℓ′(θ^n)를 테일러 전개를 이용하여 처음 두 항만을 취하면
ℓ′(θ^n)≈ℓ′(θ0)+ℓ′′(θ0)(θ^n−θ0)
으로 나타낼 수 있다. θ^n이 θ0의 일치추정량이므로 n이 커질 때 두 값이 확률적으로 매우 가까우므로 테일러 전개에서 고차항들은 무시할 수 있다. ℓ′(θ^n)=0이므로
θ^n−θ0≈−ℓ′′(θ0)ℓ′(θ0)
과 같은 근사식을 얻을 수 있고, 이로부터
n(θ^n−θ0)≈−n1ℓ′′(θ0)n1ℓ′(θ0)
을 얻는다. 적절한 조건하에 대수의 법칙에 의해 분모는 다음과 같이 피셔의 정보량으로 확률수렴한다.
−n1ℓ′′(θ0)=−n1i=1∑ndθ2d2log f(Xi;θ)∣∣∣∣∣∣θ=θ0p−E{dθ2d2log f(X;θ)}∣∣∣∣∣θ=θ0=I(θ)
이 때 분자 n1ℓ′(θ0)dN(0, I(θ)) 이므로(2),
n(θ^n−θ0)≈I(θ)1n1ℓ′(θ0)dI(θ0)1N(0, θ0)
슬럿츠키 정리와 정규분포 특징을 이용해 다음과 같은 최대가능도 추정량의 점근적 정규성을 보이 수 있다.
n(θ^n−θ0)dN(0, I(θ0)1)
(2): https://velog.io/@choyun/commentary
예 4. 44
X1,X2,…,Xn이 EXP(θ)에서 관측되는 랜덤표본이라고 하자. θ의 최대가능도 추정량은
ℓ(θ;x1,…,xn)ℓ′(θ;x1,…,xn)=−nlog θ−θ∑i=1nxi=−θn−θ2∑i=1nxi
으로부터 θ^n=Xˉn이고,
(∂θ2∂2)log f(x;θ)=1/θ2−2x/θ3
이므로
I(θ)=Eθ(θ32X−θ21)=θ21
이다. 그러므로 정리 4.13에 의해,
n(Xˉn−θ)dN(0, θ2)
가 되고, 이것은 중심극한정리에서 얻은 결과와 동일하다.
[참고문헌]