4.2 최대가능도 추정법
확률변수 X1,X2,…,Xn의 결합확률밀도함수가 f(x1,x2,…,xn;θ)라고 하자. 결합 확률밀도함수 f(x1,x2,…,xn;θ)는 고정된 모수 θ에 대하여 (x1,x2,…,xn)의 함수로 사용된다. 그러나 반대로 f(x1,x2,…,xn;θ)를 관측치 X1=x1,X2=x2,…,Xn=xn이 주어졌을 때 모수 θ의 함수로 생각해 볼 수도 있다.
L(θ)=L(θ;x1,x2,…,xn)=f(x1,x2,…,xn;θ)
로 표기하고 이를 X1,X2,…,Xn의 가능도함수(likelihood function)라고 한다. 다시말하면 가능도함수 L(θ)는 주어진 자료 (x1,x2,…,xn)에 대하여, (x1,x2,…,xn)이 얻어질 가능성을 모수 θ에 대한 함수로 나타낸 것으로 가능도함수는 θ의 함수이므로 확률밀도함수는 아니다.
이제 확률변수 X1,X2,…,Xn이 서로 독립이고 Xi가 확률밀도함수 fi(xi,θ)를 갖는다고 하면, X1,X2,…,Xn의 결합 확률밀도함수는
i=1∏nfi(xi;θ)=f1(x1;θ)f2(x2;θ)…fn(xn;θ)
이며, 가능도함수는
L(θ;x1,x2,…,xn)=i=1∏nfi(xi;θ)=f1(x1;θ)f2(x2;θ)…fn(xn;θ)
로 나타내어진다. 따라서 X1,X2,…,Xn이 확률밀도함수 f(x;θ)로부터의 랜덤표본이라고 하면 fi(xi;θ)=f(xi;θ)이므로 가능도함수는
L(θ;x1,x2,…,xn)=i=1∏nf(xi;θ)
가 된다. 이제 모수를 추정하는 방법으로 가능도함수를 최대화하는 통계량에 대한 정의는 다음과 같다.
정의 4.2
랜덤표본의 가능도함수 L(θ;x1,x2,…,xn)을 최대화하는 θ의 값을
θ^=θ^(x1,x2,…,xn)∈Ω
라고 할 때, θ^=θ^(X1,X2,…,Xn)을 모수 θ의 최대가능도 추정량이라고 한다.
이러한 최대가능도 추정량의 의미는 '실제로 관측된' 자료가 얻어질 확률을 가장 높게 만드는 θ의 값을 모수 θ의 추정량으로 삼는 것이다.
그런데 가능도함수 L(θ;x1,x2,…,xn)을 최대화하는 θ의 값을 찾는 문제는 로그가능도함수
logL(θ;x1,x2,…,xn)=logi=1∏nf(xi;θ)=i=1∑nlog f(xi;θ)
를 최대화하는 θ를 찾는 것과 같다. (로그함수: 단조증가함수이므로) 또한 로그를 취하면 각 주변 확률밀도함수에 로그를 취한 것의 합이 되므로 미분을 통해 최댓값을 찾는 계산이 훨씬 쉬워질 수 있다. 이런 이유로, 최대가능도 추정량을 찾을 떄 로그가능도함수를 많이 이용한다. 또한 로그가능도 함수를 최대화하는 문제는
dθdlogL(θ;x1,x2,…,xn)=0
의 해를 구하는 문제로 귀착된다.
예 4.5
X1,X2,…,Xn을 EXP(θ)에서 추출된 랜덤표본이라고 할 때, 가능도함수는
L(θ;x1,x2,…,xn)=i=1∏nf(xi;θ)=(θ1)nexp(−i=1∑n−xi/θ)
가 되며, 로그가능도함수는
logL(θ;x1,x2,…,xn)=−nlogθ−i=1∑n−xi/θ
가 된다. 이를 θ에 대해 미분하면
dθdlogL(θ)=−θn+i=1∑nxi/θ2=0
이고, 이를 0으 만드는 값은 xˉn이다. 즉, θ의 최대가능도 추정량은 Xˉn이다.
예 4.6
X1,X2,…,Xn을 포아송(λ)분포로부터 구한 랜덤표본이라고 할 때, 가능도함수는
L(λ;x1,x2,…,xn)=i=1∏nf(xi;λ)=∏i=1nxi!e−nλλ∑xi
가 되며, 로그가능도함수는
logL(λ;x1,x2,…,xn)=log{e−nλ}+log{λ∑xi}−log{i=1∏nxi!}=−nλ+i=1∑nxilogλ−log(i=1∏nxi!)
가 된다. 이를 λ에 대해 미분하면
dλdlogL(λ)=−n+i=1∑nλxi=0
을 만족하는 λ의 최대가능도 추정량λ^은 Xˉn이다.
예 4.7
X1,X2,…,Xn을 N(μ,σ2)분포로부터 구한 랜덤표본이라고 할 때, 가능도함수는
L(μ,σ2;x1,x2,…,xn)=i=1∏nf(xi;μ,σ2)=(2πσ2)n/21exp[i=1∑n(xi−μ)2/2σ2]
가 되며, 로그가능도함수는
logL(μ,σ2;x1,x2,…,xn)=log{(2πσ2)n/21}+log{exp[i=1∑n(xi−μ)2/2σ2]}=−(n/2)log(2πσ2)−i=1∑n(xi−μ)2/2σ2
가 된다. 이 로그가능도함수를 최대화하는 (μ,σ2)값은
1)dμdlogL(μ,σ2;x1,x2,…,xn)=dμd{−(n/2)log(2πσ2)−i=1∑n(xi−μ)2/2σ2}=−i=1∑nσ2(xi−μ)(1)
2)dσ2dlogL(μ,σ2;x1,x2,…,xn)=dμd{−(n/2)log(2πσ2)−i=1∑n(xi−μ)2/2σ2}=−2n2πσ22π−4σ42⋅∑i=1n(xi−μ)2=−2σ2n+2σ4∑i=1n(xi−μ)2(2)
두 연립방정식의 해를 구하여 μ,σ2의 최대가능도 추정량을 계산한다.
1)dμdlogL(μ,σ2;x1,x2,…,xn)=i=1∑nσ2(xi−μ)=0=i=1∑n(xi−μ)=0=nμ=i=1∑nxi∴μ=Xnˉ
2)dσ2dlogL(μ,σ2;x1,x2,…,xn)=−2σ2n+2σ4∑i=1n(xi−μ)2=0=2σ4∑i=1n(xi−μ)2=2σ2n=i=1∑n(xi−μ)2=nσ2∴σ2=i=1∑n(Xi−Xˉ)2/n
따라서 최대 가능도 추정량은 다음과 같다.
(μ,σ2)=(Xnˉ, i=1∑n(Xi−Xˉ)2/n)
[참고문헌]