5.3 일반화 가능도비 검정법
대립가설이 양측으로 주어진다는지 검정의 직접 대상이 아닌 장애모수가 존재할 때, 즉 관심대상이 되는 모수 외에 다른 미지의 모수가 존재하는 등 최강력 검정법과 균일최강력 검정법의 접근방법을 직접 적용할 수 없는 경우 일반화 가능도비 검정법을 사용한다.
\\[20pt]
정의 5.6
랜덤표본 X 1 , X 2 , … , X n X_1,X_2,\ldots,X_n X 1 , X 2 , … , X n 의 결합 확률밀도함수가 f ( x 1 , x 2 , … , x n ; θ ) f(x_1,x_2,\ldots,x_n;\theta) f ( x 1 , x 2 , … , x n ; θ ) 로 주어졌다고 하자.
H 0 : θ ∈ Ω 0 vs H 0 : θ ∈ Ω 1 ( = Ω − Ω 0 ) H_0:\theta\in\Omega_0\quad\text{vs}\quad H_0:\theta\in\Omega_1\ (=\Omega-\Omega_0) H 0 : θ ∈ Ω 0 vs H 0 : θ ∈ Ω 1 ( = Ω − Ω 0 )
를 고려할 때, 일반화 가능도비는
Λ ( x 1 , x 2 , … , x n ) = max θ ∈ Ω 0 L ( θ ; x 1 , x 2 , … , x n ) max θ ∈ Ω L ( θ ; x 1 , x 2 , … , x n ) = L ( θ ^ 0 ) L ( θ ^ n ) \Lambda(x_1,x_2,\ldots,x_n) =\dfrac{\text{max}_{\theta\in\Omega_0}L(\theta;x_1,x_2,\ldots,x_n)}{\text{max}_{\theta\in\Omega}L(\theta;x_1,x_2,\ldots,x_n)} =\dfrac{L(\hat{\theta}_0)}{L(\hat{\theta}_n)} Λ ( x 1 , x 2 , … , x n ) = max θ ∈ Ω L ( θ ; x 1 , x 2 , … , x n ) max θ ∈ Ω 0 L ( θ ; x 1 , x 2 , … , x n ) = L ( θ ^ n ) L ( θ ^ 0 )
으로 추정된다.
θ ^ n \hat{\theta}_n θ ^ n : 모수 θ \theta θ 의 최대가능도 추정량,
θ ^ 0 \hat{\theta}_0 θ ^ 0 : 귀무가설이 참이라는 조건하에서 가능도함수를 최대로 만드는 θ \theta θ 의 최대가능도 추정량
여러 가능한 모수값들 가운데 주어진 관측값을 가장 잘 설명하는, 즉 실제로 관측된 자료가 얻어질 확률을 가장 높게 만드는 모수값을 이용.
분자: 네이만-피어슨 정리와 같이 귀무가설이 참이라는 조건하에 전체 모수공간의 부분집합 공간 (귀무가설 조건 하에서)에서의 최대가능도 추정량.
분모: 네이만-피어슨 정리와 달리 대립가설하에서의 최대가능도 추정량이 아닌 전체 모수공간에서의 최대가능도 추정량
이와 같이 정의된 일반화 가능도비 Λ \Lambda Λ 는 언제나 양수이지만 1보다 클 수 없다.
Λ \Lambda Λ 의 값이 1에 가까우면 귀무가설에 부합하여 귀무가설을 기각할 이유가 없음.
Λ \Lambda Λ 의 값이 0에 가까우면 귀무가설에 부합하지 않아 귀무가설을 기각할 증거가 됨.
\\[20pt]
정의 5.7
유의수준이 α \alpha α 인 일반화 가능도비 검정법은 0 ≤ Λ ≤ λ ∗ 0\le\Lambda\le\lambda^* 0 ≤ Λ ≤ λ ∗ 인 경우 H 0 H_0 H 0 을 기각한다. 단, λ ∗ \lambda^* λ ∗ 는 max P ( 0 ≤ Λ ≤ λ ∗ ) = α \text{max}P(0\le\Lambda\le\lambda^*)=\alpha max P ( 0 ≤ Λ ≤ λ ∗ ) = α 를 만족하는 상수이며 0 ≤ λ ∗ ≤ 1 0\le\lambda^*\le1 0 ≤ λ ∗ ≤ 1 이다.
귀무가설 하에서 확률변수 Λ \Lambda Λ 의 확률밀도함수가 f ( λ ∣ H 0 ) f(\lambda|H_0) f ( λ ∣ H 0 ) 이면 임계값 λ ∗ \lambda^* λ ∗ 는 방정식
α = ∫ 0 λ ∗ f ( λ ∣ H 0 ) d λ \alpha=\int_{0}^{\lambda^*} f(\lambda|H_0) d\lambda α = ∫ 0 λ ∗ f ( λ ∣ H 0 ) d λ
를 풀어 구할 수 있다. (본문 그림 5.4 참조)
\\[20pt]
예 5.21
X 1 , X 2 , … , X n X_1,X_2,\ldots,X_n X 1 , X 2 , … , X n 이 U ( 0 , θ ) U(0,\theta) U ( 0 , θ ) 로부터 얻은 랜덤표본이라고 하고,
H 0 : θ = θ 0 vs H 1 : θ < θ 0 H_0:\theta=\theta_0\quad\text{vs}\quad H_1:\theta<\theta_0 H 0 : θ = θ 0 vs H 1 : θ < θ 0
의 가설검정을 생각해 보자. 이때 모수공간 Ω \Omega Ω 는 { θ : θ ≤ θ 0 } \{\theta:\theta\le\theta_0\} { θ : θ ≤ θ 0 } 이므로 X ( n ) ≤ θ 0 X_{(n)}\le\theta_0 X ( n ) ≤ θ 0 을 가정할 수 있고, 일반화 가능도비는
Λ ( X 1 , X 2 , … , X n ) = [ X ( n ) θ 0 ] n \Lambda(X_1,X_2,\ldots,X_n)=\left[\dfrac{X_{(n)}}{\theta_0}\right]^n Λ ( X 1 , X 2 , … , X n ) = [ θ 0 X ( n ) ] n
이 되므로 유의수준이 α \alpha α 인 일반화 가능도비 검정법의 기각영역은 X ( n ) θ 0 ≤ λ ∗ \dfrac{X_{(n)}}{\theta_0}\le\lambda^* θ 0 X ( n ) ≤ λ ∗ 이다. 단 λ ∗ \lambda^* λ ∗ 는
α = P [ ( X ( n ) θ 0 ) n ≤ λ ∗ ∣ H 0 ] = P [ X ( n ) θ 0 ≤ ( λ ∗ ) 1 / n ∣ H 0 ] \begin{aligned} \alpha&=P\left[\left.\left(\dfrac{X_{(n)}}{\theta_0}\right)^n\le\lambda^*\right|H_0\right] \\[15pt] &=P\left[\left.\dfrac{X_{(n)}}{\theta_0}\le\left(\lambda^*\right)^{1/n}\right|H_0\right] \\[15pt] \end{aligned} α = P [ ( θ 0 X ( n ) ) n ≤ λ ∗ ∣ ∣ ∣ ∣ ∣ H 0 ] = P [ θ 0 X ( n ) ≤ ( λ ∗ ) 1 / n ∣ ∣ ∣ ∣ ∣ H 0 ]
를 만족시킨다. 이제
W = X ( n ) θ 0 , w ∗ = ( λ ∗ ) 1 / n W=\dfrac{X_{(n)}}{\theta_0},\quad w^*=(\lambda^*)^{1/n} W = θ 0 X ( n ) , w ∗ = ( λ ∗ ) 1 / n
라고 정의하면, W W W 의 확률밀도함수가 0 < w < 1 0<w<1 0 < w < 1 에서 f ( w ) = n w n − 1 f(w)=nw^{n-1} f ( w ) = n w n − 1 이므로
α = ∫ 0 w ∗ n w n − 1 d w = ( w ∗ ) n \begin{aligned} \alpha&=\int_{0}^{w^*}nw^{n-1}dw\\[15pt] &=(w^*)^n \end{aligned} α = ∫ 0 w ∗ n w n − 1 d w = ( w ∗ ) n
가 된다. 그러므로 가설에 대한 유의수준 α \alpha α 인 일반화 가능도비 검정법의 기각영역은
W = X ( n ) θ 0 ≤ α 1 / n W=\dfrac{X_{(n)}}{\theta_0}\le \alpha^{1/n} W = θ 0 X ( n ) ≤ α 1 / n
으로 주어진다.
이 결과는 가설에 대한 균일최강력 검정법과 일치하는데 이는 다음과 같이 보일 수 있다. θ 0 < θ 1 \theta_0<\theta_1 θ 0 < θ 1 인 θ 0 \theta_0 θ 0 과 θ 1 \theta_1 θ 1 에 대하여, 가능도비 L R ( θ 0 , θ 1 ; x 1 , x 2 , … , x n ) LR(\theta_0,\theta_1;x_1,x_2,\ldots,x_n) L R ( θ 0 , θ 1 ; x 1 , x 2 , … , x n ) 는
L R ( θ 0 , θ 1 ; x 1 , x 2 , … , x n ) = { ( θ 1 θ 0 ) n , x ( n ) ≤ θ 1 ∞ , θ 1 < x ( n ) ≤ θ 0 LR(\theta_0,\theta_1;x_1,x_2,\ldots,x_n) =\begin{cases} \left(\dfrac{\theta_1}{\theta_0}\right)^n, & x_{(n)}\le\theta_1\\[15pt] \infty, & \theta_1<x_{(n)}\le\theta_0 \end{cases} L R ( θ 0 , θ 1 ; x 1 , x 2 , … , x n ) = ⎩ ⎪ ⎪ ⎪ ⎨ ⎪ ⎪ ⎪ ⎧ ( θ 0 θ 1 ) n , ∞ , x ( n ) ≤ θ 1 θ 1 < x ( n ) ≤ θ 0
가 된다. 이 가능도비는 T ( X 1 , X 2 , … , X n ) = X ( n ) T(X_1,X_2,\ldots,X_n)=X_{(n)} T ( X 1 , X 2 , … , X n ) = X ( n ) 에 대해 비감소함수이므로 X ( n ) X_{(n)} X ( n ) 에 대해 단조가능도비의 성질을 갖는다. 그러므로 정리 5.2에 의해, P ( X ( n ) ≤ k ∣ H 0 ) = α P(X_{(n)}\le k|H_0)=\alpha P ( X ( n ) ≤ k ∣ H 0 ) = α 인 k k k 에 대해 { ( x 1 , x 2 , … , x n ) : x ( n ) ≤ k } \{(x_1,x_2,\ldots,x_n):x_{(n)}\le k\} { ( x 1 , x 2 , … , x n ) : x ( n ) ≤ k } 가 유의수준 α \alpha α 인 균일최강력 검정법의 기각영역이 된다. 귀무가설하에서 X ( n ) X_{(n)} X ( n ) 의 분포를 이용하여
k = θ 0 α 1 / n k=\theta_0\alpha^{1/n} k = θ 0 α 1 / n
임을 알 수 있고 그에 따라 이기각영역이 일반화 가능도비 기각영역과 같음을 알 수 있다.
\\[20pt]
그러나 많은 경우에 Λ \Lambda Λ 의 분포는 알려져 있지 않으며, Λ \Lambda Λ 의 단조변환꼴로 표현되는 통계량의 귀무가설하에서의 분포를 이용하여 기각영역을 구할 수 있다.
예 5.22
X 1 , X 2 , … , X n X_1,X_2,\ldots,X_n X 1 , X 2 , … , X n 이 정규분포 N ( μ , σ 2 ) N(\mu,\sigma^2) N ( μ , σ 2 ) 으로부터 얻은 랜덤표본이라고 하고, 모분산 σ 2 \sigma^2 σ 2 알려져 있는 경우
H 0 : μ = μ 0 vs H 1 : μ ≠ μ 0 H_0:\mu=\mu_0\quad\text{vs}\quad H_1:\mu\neq\mu_0 H 0 : μ = μ 0 vs H 1 : μ = μ 0
을 고려해보자. 가능도함수가 T ( X 1 , X 2 , … , X n ) = ∑ i = 1 n X i T(X_1,X_2,\ldots,X_n)=\sum_{i=1}^{n}X_i T ( X 1 , X 2 , … , X n ) = ∑ i = 1 n X i 에 대해 비증가하는 단조가능도비의 성질이 있으므로 대립가설이 H 1 : μ > μ 0 H_1:\mu>\mu_0 H 1 : μ > μ 0 이면 균일최강력 검정법의 기각영역이 { ∑ i = 1 n X i ≥ k } \{\sum_{i=1}^{n}X_i\ge k\} { ∑ i = 1 n X i ≥ k } 의 형태를 가지고 대립가설이 H 1 : μ < μ 0 H_1:\mu<\mu_0 H 1 : μ < μ 0 이면 균일최강력 검정법의 기각영역이 { ∑ i = 1 n X i ≤ k } \{\sum_{i=1}^{n}X_i\le k\} { ∑ i = 1 n X i ≤ k } 의 형태를 갖는다. 그러나 최강력 검정법의 기각영역이 μ − μ 0 \mu-\mu_0 μ − μ 0 의 부호에 의존하므로 대립가설이 H 1 : μ ≠ μ 0 H_1:\mu\neq\mu_0 H 1 : μ = μ 0 이면 균일최강력 검정법이 존재하지 않는다.
이제 양측 대립가설에 대해 일반화 가능도비 검정법의 기각영역을 구해 보자. μ \mu μ 의 최대가능도 추정량이 X ˉ n \bar{X}_n X ˉ n 이므로 일반화 가능도비는
Λ ( X 1 , X 2 , … , X n ) = ( 2 π σ 2 ) − n / 2 exp [ − ∑ i = 1 n ( X i − μ ) 2 / ( 2 σ 2 ) ] ( 2 π σ 2 ) − n / 2 exp [ − ∑ i = 1 n ( X i − X ˉ n ) 2 / ( 2 σ 2 ) ] = exp ( − n 2 σ 2 ( X ˉ n − μ ) 2 ) \begin{aligned} \Lambda(X_1,X_2,\ldots,X_n) &=\dfrac{(2\pi\sigma^2)^{-n/2}\exp\left[-\sum_{i=1}^{n}(X_i-\mu)^2/(2\sigma^2)\right]}{(2\pi\sigma^2)^{-n/2}\exp\left[-\sum_{i=1}^{n}(X_i-\bar{X}_n)^2/(2\sigma^2)\right]} \\[15pt] &=\exp\left(-\dfrac{n}{2\sigma^2}(\bar{X}_n-\mu)^2\right) \end{aligned} Λ ( X 1 , X 2 , … , X n ) = ( 2 π σ 2 ) − n / 2 exp [ − ∑ i = 1 n ( X i − X ˉ n ) 2 / ( 2 σ 2 ) ] ( 2 π σ 2 ) − n / 2 exp [ − ∑ i = 1 n ( X i − μ ) 2 / ( 2 σ 2 ) ] = exp ( − 2 σ 2 n ( X ˉ n − μ ) 2 )
이 되고, 기각영역은 exp ( − n 2 σ 2 ( X ˉ n − μ ) 2 ) ≤ λ ∗ \exp\left(-\dfrac{n}{2\sigma^2}(\bar{X}_n-\mu)^2\right)\le\lambda^* exp ( − 2 σ 2 n ( X ˉ n − μ ) 2 ) ≤ λ ∗ 가 된다. 여기에서 λ ∗ \lambda^* λ ∗ 는
α = P [ exp ( − n 2 σ 2 ( X ˉ n − μ ) 2 ) ≤ λ ∗ ∣ H 0 ] \alpha=P\left[\left.\exp\left(-\dfrac{n}{2\sigma^2}(\bar{X}_n-\mu)^2\right)\le\lambda^*\right|H_0\right] α = P [ exp ( − 2 σ 2 n ( X ˉ n − μ ) 2 ) ≤ λ ∗ ∣ ∣ ∣ ∣ H 0 ]
를 만족한다. 이 기각영역은 ∣ X ˉ n − μ ∣ ≥ c |\bar{X}_n-\mu|\ge c ∣ X ˉ n − μ ∣ ≥ c 와 동등하고 귀무가설하에서 X ˉ n ∼ N ( μ 0 , σ 2 / n ) \bar{X}_n\sim N(\mu_0,\sigma^2/n) X ˉ n ∼ N ( μ 0 , σ 2 / n ) 을 따르므로
α = P [ ∣ X ˉ n − μ ∣ ≥ c ∣ H 0 ] \alpha=P[|\bar{X}_n-\mu|\ge c|H_0] α = P [ ∣ X ˉ n − μ ∣ ≥ c ∣ H 0 ]
로부터 c = z α / 2 σ n c=z_{\alpha/2}\dfrac{\sigma}{\sqrt{n}} c = z α / 2 n σ 임을 알 수 있다. 즉, 유의수준 α \alpha α 인 일반화ㅏ 가능도비 검정법의 기각영역은
{ ( x 1 , … , x n ) : x ˉ n ≥ μ + z α / 2 σ n or x ˉ n ≤ μ − z α / 2 σ n } \{(x_1,\ldots,x_n):\bar{x}_n\ge\mu+z_{\alpha/2}\dfrac{\sigma}{\sqrt{n}}\quad \text{or}\quad \bar{x}_n\le\mu-z_{\alpha/2}\dfrac{\sigma}{\sqrt{n}}\} { ( x 1 , … , x n ) : x ˉ n ≥ μ + z α / 2 n σ or x ˉ n ≤ μ − z α / 2 n σ }
\\[30pt]
근사 가능도비 검정법
위의 예들에서는 일반화 가능도비를 적절히 변환시킴으로써 필요한 검정통계량의 분포를 구하였다. 하지만 때에 따라서 언제나 이러한 변환이 가능한 것은 아니며 또한 기각영역을 찾기가 매우 어렵거나 불가능할 수도 있다. 이런 경우 표본의 크기가 충분히 크다면 다음 정리 5.3에 근거하여 일반화 가능도비 통계량의 근사분포를 구할 수 있다.
\\[20pt]
정리 5.3
최대가능도 추정량의 점근적 정규성을 보인 정리 4.13에서와 같은 적절한 조건이 만족될 때, − 2 log Λ ( X 1 , X 2 , … , X n ) -2\text{log }\Lambda(X_1,X_2,\ldots,X_n) − 2 log Λ ( X 1 , X 2 , … , X n ) 은 귀무가설하에서 자유도가 k k k 인 카이제곱분포를 근사적으로 따른다.
− 2 log Λ -2\text{log }\Lambda − 2 log Λ 는 Λ \Lambda Λ 의 감소함수이므로 Λ \Lambda Λ 의 값이 충분히 작을 때 귀무가설을 기각하는 것은 − 2 log Λ -2\text{log }\Lambda − 2 log Λ 가 충분히 클 때 귀무가설을 기각하는 것과 동일한 검정법
\\[20pt]
예 5.25
X 1 , X 2 , … , X n X_1,X_2,\ldots,X_n X 1 , X 2 , … , X n 이 베르누이 ( p ) (p) ( p ) 에서의 랜덤표본이라 하고
H 0 : p = p 0 vs H 1 : p ≠ p 0 H_0:p=p_0\quad\text{vs}\quad H_1:p\neq p_0 H 0 : p = p 0 vs H 1 : p = p 0
의 가설검정을 고려해 보자. 대립가설이 양측이므로 이 경우 균일최갈역 검정법이 존재하지 않음을 쉽게 보일 수 있다. Ω = { 0 < p < 1 } \Omega=\{0<p<1\} Ω = { 0 < p < 1 } 에서 p p p 의 최대가능도 추정량이 X ˉ n \bar{X}_n X ˉ n 이므로 일반화 가능도비는
Λ ( X 1 , X 2 , … , X n ) = p 0 ∑ X i ( 1 − p 0 ) n − ∑ X i X ˉ n ∑ X i ( 1 − X ˉ n ) n − ∑ X i = ( p 0 X ˉ n ) n X ˉ n ( 1 − p 0 1 − X ˉ n ) n − n X ˉ n \begin{aligned} \Lambda(X_1,X_2,\ldots,X_n) &=\dfrac{p_0^{\sum X_i}(1-p_0)^{n-\sum X_i}}{\bar{X}_n^{\sum X_i}(1-\bar{X}_n)^{n-\sum X_i}} \\[15pt] &=\left(\dfrac{p_0}{\bar{X}_n}\right)^{n\bar{X}_n}\left(\dfrac{1-p_0}{1-\bar{X}_n}\right)^{n-n\bar{X}_n} \end{aligned} Λ ( X 1 , X 2 , … , X n ) = X ˉ n ∑ X i ( 1 − X ˉ n ) n − ∑ X i p 0 ∑ X i ( 1 − p 0 ) n − ∑ X i = ( X ˉ n p 0 ) n X ˉ n ( 1 − X ˉ n 1 − p 0 ) n − n X ˉ n
이때
g ( x ) = ( p 0 x ) n x ( 1 − p 0 1 − x ) n − n x g(x)=\left(\dfrac{p_0}{x}\right)^{nx}\left(\dfrac{1-p_0}{1-x}\right)^{n-nx} g ( x ) = ( x p 0 ) n x ( 1 − x 1 − p 0 ) n − n x
라 놓으면 미분을 통해 log g ( x ) \text{log }g(x) log g ( x ) 가 x < p 0 x<p_0 x < p 0 에서 증가하고 x > p 0 x>p_0 x > p 0 에서 감소함을 쉽게 알 수 있다. 로그함수도 동일하다. 즉, Λ ( X 1 , … , X n ) ≤ k \Lambda(X_1,\ldots,X_n)\le k Λ ( X 1 , … , X n ) ≤ k 는 c 1 < p 0 < c 2 c_1<p_0<c_2 c 1 < p 0 < c 2 인 상수 c 1 c_1 c 1 과 c 2 c_2 c 2 에 대하여 X ˉ n ≤ c 1 \bar{X}_n\le c_1 X ˉ n ≤ c 1 또는 X ˉ n ≥ c 2 \bar{X}_n\ge c_2 X ˉ n ≥ c 2 라는 양측 기각영역과 동등히다. 중심극한정리에 의해, n n n 이 클 때 귀무가설하에서
X ˉ n ∼ N ( p 0 , p 0 ( 1 − p 0 ) n ) \bar{X}_n\sim N(p_0,\dfrac{p_0(1-p_0)}{n}) X ˉ n ∼ N ( p 0 , n p 0 ( 1 − p 0 ) )
이 근사적으로 성립하므로,
X ˉ n ≤ p 0 − z α / 2 p 0 ( 1 − p 0 ) / n or X ˉ n ≥ p 0 + z α / 2 p 0 ( 1 − p 0 ) / n \bar{X}_n\le p_0 - z_{\alpha/2}\sqrt{p_0(1-p_0)/n}\quad \text{or}\quad \bar{X}_n\ge p_0 + z_{\alpha/2}\sqrt{p_0(1-p_0)/n} X ˉ n ≤ p 0 − z α / 2 p 0 ( 1 − p 0 ) / n or X ˉ n ≥ p 0 + z α / 2 p 0 ( 1 − p 0 ) / n
가 유의수준 α \alpha α 인 근사 기각영역이 { ( x 1 , x 2 , … , x n ) : − 2 log Λ ( x 1 , x 2 , … , x n ) ≥ χ α 2 ( 1 ) } \{(x_1,x_2,\ldots,x_n):-2\text{log }\Lambda(x_1,x_2,\ldots,x_n)\ge \chi_{\alpha}^2(1)\} { ( x 1 , x 2 , … , x n ) : − 2 log Λ ( x 1 , x 2 , … , x n ) ≥ χ α 2 ( 1 ) } 이 될 것이다.
\\[20pt]
예 5.26
예 5.23 에서 다루어진 양측 t t t 검점에 대해 일반화 가능도비는
Λ ( X 1 , X 2 , … , X n ) = [ ∑ i = 1 n ( X i − X ˉ n ) 2 ∑ i = 1 n ( X i − μ 0 ) 2 ] n / 2 = [ ∑ i = 1 n { ( X i − X ˉ n ) + ( X ˉ n − μ 0 ) } 2 ∑ i = 1 n ( X i − X ˉ n ) 2 ] − n / 2 = [ ∑ i = 1 n { ( X i − X ˉ n ) 2 + ( X ˉ n − μ 0 ) 2 + 2 ( X i − X ˉ n ) ( X ˉ n − μ 0 ) } ∑ i = 1 n ( X i − X ˉ n ) 2 ] − n / 2 = [ ∑ i = 1 n ( X i − X ˉ n ) 2 + ∑ i = 1 n ( X ˉ n − μ 0 ) 2 ∑ i = 1 n ( X i − X ˉ n ) 2 ] − n / 2 = [ ∑ i = 1 n ( X i − X ˉ n ) 2 + n ( X ˉ n − μ 0 ) 2 ∑ i = 1 n ( X i − X ˉ n ) 2 ] − n / 2 = [ 1 + n ( X ˉ n − μ 0 ) 2 ∑ i = 1 n ( X i − X ˉ n ) 2 ] − n / 2 \begin{aligned} \Lambda(X_1,X_2,\ldots,X_n) &=\left[\dfrac{\sum_{i=1}^{n}(X_i-\bar{X}_n)^2}{\sum_{i=1}^{n}(X_i-\mu_0)^2}\right]^{n/2} \\[15pt] &=\left[\dfrac{\sum_{i=1}^{n}\{(X_i-\bar{X}_n)+(\bar{X}_n-\mu_0)\}^2}{\sum_{i=1}^{n}(X_i-\bar{X}_n)^2}\right]^{-n/2} \\[15pt] &=\left[\dfrac{\sum_{i=1}^{n}\{(X_i-\bar{X}_n)^2+(\bar{X}_n-\mu_0)^2+2(X_i-\bar{X}_n)(\bar{X}_n-\mu_0)\}}{\sum_{i=1}^{n}(X_i-\bar{X}_n)^2}\right]^{-n/2} \\[15pt] &=\left[\dfrac{\sum_{i=1}^{n}(X_i-\bar{X}_n)^2+\sum_{i=1}^{n}(\bar{X}_n-\mu_0)^2}{\sum_{i=1}^{n}(X_i-\bar{X}_n)^2}\right]^{-n/2} \\[15pt] &=\left[\dfrac{\sum_{i=1}^{n}(X_i-\bar{X}_n)^2+n(\bar{X}_n-\mu_0)^2}{\sum_{i=1}^{n}(X_i-\bar{X}_n)^2}\right]^{-n/2} \\[15pt] &=\left[1+\dfrac{n(\bar{X}_n-\mu_0)^2}{\sum_{i=1}^{n}(X_i-\bar{X}_n)^2}\right]^{-n/2} \\[15pt] \end{aligned} Λ ( X 1 , X 2 , … , X n ) = [ ∑ i = 1 n ( X i − μ 0 ) 2 ∑ i = 1 n ( X i − X ˉ n ) 2 ] n / 2 = [ ∑ i = 1 n ( X i − X ˉ n ) 2 ∑ i = 1 n { ( X i − X ˉ n ) + ( X ˉ n − μ 0 ) } 2 ] − n / 2 = [ ∑ i = 1 n ( X i − X ˉ n ) 2 ∑ i = 1 n { ( X i − X ˉ n ) 2 + ( X ˉ n − μ 0 ) 2 + 2 ( X i − X ˉ n ) ( X ˉ n − μ 0 ) } ] − n / 2 = [ ∑ i = 1 n ( X i − X ˉ n ) 2 ∑ i = 1 n ( X i − X ˉ n ) 2 + ∑ i = 1 n ( X ˉ n − μ 0 ) 2 ] − n / 2 = [ ∑ i = 1 n ( X i − X ˉ n ) 2 ∑ i = 1 n ( X i − X ˉ n ) 2 + n ( X ˉ n − μ 0 ) 2 ] − n / 2 = [ 1 + ∑ i = 1 n ( X i − X ˉ n ) 2 n ( X ˉ n − μ 0 ) 2 ] − n / 2
로 주어진다 따라서
− 2 log Λ ( x 1 , x 2 , … , x n ) = − 2 log [ 1 + n ( X ˉ n − μ 0 ) 2 ∑ i = 1 n ( X i − X ˉ n ) 2 ] − n / 2 = n log [ 1 + n ( X ˉ n − μ 0 ) 2 ∑ i = 1 n ( X i − X ˉ n ) 2 ] \begin{aligned} -2\log\Lambda(x_1,x_2,\ldots,x_n) &=-2\log\left[1+\dfrac{n(\bar{X}_n-\mu_0)^2}{\sum_{i=1}^{n}(X_i-\bar{X}_n)^2}\right]^{-n/2} \\[15pt] &=n\log\left[1+\dfrac{n(\bar{X}_n-\mu_0)^2}{\sum_{i=1}^{n}(X_i-\bar{X}_n)^2}\right] \end{aligned} − 2 log Λ ( x 1 , x 2 , … , x n ) = − 2 log [ 1 + ∑ i = 1 n ( X i − X ˉ n ) 2 n ( X ˉ n − μ 0 ) 2 ] − n / 2 = n log [ 1 + ∑ i = 1 n ( X i − X ˉ n ) 2 n ( X ˉ n − μ 0 ) 2 ]
이다. 테일러 정리로부터 ∣ x ∣ ≈ 0 |x|\approx0 ∣ x ∣ ≈ 0 인 경우 log ( 1 + x ) ≈ x \log(1+x)\approx x log ( 1 + x ) ≈ x 라는 근사관계로부터
− 2 log Λ ( x 1 , x 2 , … , x n ) ≈ n ( X ˉ n − μ 0 ) 2 1 n ∑ i = 1 n ( X i − X ˉ n ) 2 \begin{aligned} -2\log\Lambda(x_1,x_2,\ldots,x_n) \approx \dfrac{n(\bar{X}_n-\mu_0)^2}{\dfrac{1}{n}\sum_{i=1}^{n}(X_i-\bar{X}_n)^2} \end{aligned} − 2 log Λ ( x 1 , x 2 , … , x n ) ≈ n 1 ∑ i = 1 n ( X i − X ˉ n ) 2 n ( X ˉ n − μ 0 ) 2
이며 1 n ∑ i = 1 n ( X i − X ˉ n ) 2 \dfrac{1}{n}\sum_{i=1}^{n}(X_i-\bar{X}_n)^2 n 1 ∑ i = 1 n ( X i − X ˉ n ) 2 는 σ 2 \sigma^2 σ 2 으로 수렴한다.
이에 충분히 큰 n n n 에 대해
− 2 log Λ ( x 1 , x 2 , … , x n ) ≈ n ( X ˉ n − μ 0 ) 2 σ 2 \begin{aligned} -2\text{log }\Lambda(x_1,x_2,\ldots,x_n) \approx \dfrac{n(\bar{X}_n-\mu_0)^2}{\sigma^2} \end{aligned} − 2 log Λ ( x 1 , x 2 , … , x n ) ≈ σ 2 n ( X ˉ n − μ 0 ) 2
이 되고 귀무가설하에서
n ( X ˉ n − μ 0 ) 2 σ 2 ∼ χ α 2 ( 1 ) \dfrac{n(\bar{X}_n-\mu_0)^2}{\sigma^2}\sim\chi_\alpha^2(1) σ 2 n ( X ˉ n − μ 0 ) 2 ∼ χ α 2 ( 1 )
이 성립하므로 일반화 가능도비 검정법은 − 2 log Λ ( x 1 , x 2 , … , x n ) ≥ χ α 2 ( 1 ) -2\text{log }\Lambda(x_1,x_2,\ldots,x_n)\ge\chi_\alpha^2(1) − 2 log Λ ( x 1 , x 2 , … , x n ) ≥ χ α 2 ( 1 ) 인 경우에 귀무가설을 기각하게 된다. 위 결과는 정리 5.3과 부합된다.
[참고문헌]