4.6 구간추정
비편향성, 적률, 가능도 등의 기준하에서 모수 또는 모수의 함수에 대한 최적의 추정량들을 고려하였으나 이들은 점추정이기 때문에 통계적 정확도를 표현하지 못한다는 결점이 있다. 따라서 신뢰구간을 정의하고 그 구간 내에 모수가 포함될 확률로써 통계적 정확도를 구한다.
\\[30pt]
정의 4.10
랜덤표본 X 1 , X 2 , … , X n X_1,X_2,\ldots,X_n X 1 , X 2 , … , X n 의 확률밀도함수가 f ( x ; θ ) , θ ∈ Ω f(x;\theta),\ \theta\in\Omega f ( x ; θ ) , θ ∈ Ω 라고 하자. 0 < α < 1 0<\alpha<1 0 < α < 1 에 대하여
P [ L ( X 1 , X 2 , … , X n ) ] ≤ θ ≤ P [ U ( X 1 , X 2 , … , X n ) ] = 1 − α P[L(X_1,X_2,\ldots,X_n)]\le \theta \le P[U(X_1,X_2,\ldots,X_n)] =1-\alpha P [ L ( X 1 , X 2 , … , X n ) ] ≤ θ ≤ P [ U ( X 1 , X 2 , … , X n ) ] = 1 − α
를 만족시키면 이를 θ \theta θ 의 100 ( 1 − α ) % 100(1-\alpha)\% 1 0 0 ( 1 − α ) % 신뢰구간이라고 한다. L ( X i ) , U ( X i ) L(X_i),\ U(X_i) L ( X i ) , U ( X i ) 를 각각 신뢰구간의 하한과 상한이라 한다.
신뢰구간을 구하는 방법
추축변량을 사용하는 방법
- 랜덤표본이 따르는 분포가 연속형일 때 신뢰구간을 구하는데 유용.
추축변량을 구하기 힘든 경우에 사용되는 일반적인 접근
\\[30pt]
정의 4.12
랜덤표본 X 1 , X 2 , … , X n X_1,X_2,\ldots,X_n X 1 , X 2 , … , X n 의 분포가 확률밀도함수 f ( x ; θ ) , θ ∈ Ω f(x;\theta),\ \theta\in\Omega f ( x ; θ ) , θ ∈ Ω 를 따른다고 하자. 이때 표본과 모수 θ \theta θ 의 함수인 확률변량 T ( X 1 , X 2 , … , X n ; θ ) T(X_1,X_2,\ldots,X_n;\theta) T ( X 1 , X 2 , … , X n ; θ ) 의 분포가 모수 θ \theta θ 에 의존하지 않으면 이를 추축변량이라고 한다.
\\[30pt]
예 4.46
X 1 , X 2 , … , X n X_1,X_2,\ldots,X_n X 1 , X 2 , … , X n 이 N ( μ , σ 2 ) N(\mu,\sigma^2) N ( μ , σ 2 ) 에서의 랜덤표본이고 S n 2 = ∑ i = 1 n ( X i − X ˉ n ) 2 / ( n − 1 ) S_n^2=\sum_{i=1}^{n}(X_i-\bar{X}_n)^2/(n-1) S n 2 = ∑ i = 1 n ( X i − X ˉ n ) 2 / ( n − 1 ) 일 때,
n ( X ˉ n − μ ) S n ∼ t ( n − 1 ) \dfrac{\sqrt{n}(\bar{X}_n-\mu)}{S_n} \sim t(n-1) S n n ( X ˉ n − μ ) ∼ t ( n − 1 )
로 모수 ( μ , σ 2 ) (\mu,\sigma^2) ( μ , σ 2 ) 에 의존하지 않으므로 추축변량이다.
\\[30pt]
정규분포의 모평균에 대한 신뢰구간
모분산이 알려진 경우
X 1 , X 2 , … , X n X_1,X_2,\ldots,X_n X 1 , X 2 , … , X n 이 N ( μ , σ 2 ) N(\mu,\sigma^2) N ( μ , σ 2 ) 에서의 랜덤표본.
n ( X ˉ n − μ ) / σ \sqrt{n}(\bar{X}_n-\mu)/\sigma n ( X ˉ n − μ ) / σ 의 분포는 N ( 0 , 1 ) N(0,1) N ( 0 , 1 ) 으로서 모수에 의존하지 않으므로 추축변량임.
P [ − z α / 2 ≤ n ( X ˉ n − μ ) σ ≤ z α / 2 ] = P [ X ˉ n − z α / 2 σ n ≤ μ ≤ X ˉ n + z α / 2 σ n ] = 1 − α \begin{aligned} P&\left[-z_{\alpha/2}\le \dfrac{\sqrt{n}(\bar{X}_n-\mu)}{\sigma}\le z_{\alpha/2}\right] \\[15pt] =P&\left[\bar{X}_n-z_{\alpha/2}\dfrac{\sigma}{\sqrt{n}} \le \mu\le \bar{X}_n+z_{\alpha/2}\dfrac{\sigma}{\sqrt{n}} \right] \\[15pt] =1&-\alpha \end{aligned} P = P = 1 [ − z α / 2 ≤ σ n ( X ˉ n − μ ) ≤ z α / 2 ] [ X ˉ n − z α / 2 n σ ≤ μ ≤ X ˉ n + z α / 2 n σ ] − α
\\[30pt]
모분산이 알려져 있지 않은 경우
모분산을 아는 경우와 달리 σ 2 \sigma^2 σ 2 에 의존하기 때문에 사용할 수 없다. 따라서 S n 2 = ∑ i = 1 n ( X i − X ˉ n ) 2 / ( n − 1 ) S_n^2=\sum_{i=1}^{n}(X_i-\bar{X}_n)^2/(n-1) S n 2 = ∑ i = 1 n ( X i − X ˉ n ) 2 / ( n − 1 ) 으로 추정한 추축변량 n ( X ˉ n − μ ) / S n \sqrt{n}(\bar{X}_n-\mu)/S_n n ( X ˉ n − μ ) / S n 이 자유도가 ( n − 1 ) (n-1) ( n − 1 ) 인 t t t 분포를 가지는 점을 이용하여 다음과 같이 구한다.
P [ − t α / 2 ( n − 1 ) ≤ n ( X ˉ n − μ ) S n ≤ t α / 2 ( n − 1 ) ] = P [ X ˉ n − t α / 2 ( n − 1 ) σ n ≤ μ ≤ X ˉ n + t α / 2 ( n − 1 ) σ n ] = 1 − α \begin{aligned} P&\left[-t_{\alpha/2}(n-1)\le \dfrac{\sqrt{n}(\bar{X}_n-\mu)}{S_n}\le t_{\alpha/2}(n-1)\right] \\[15pt] =P&\left[\bar{X}_n-t_{\alpha/2}(n-1)\dfrac{\sigma}{\sqrt{n}} \le \mu\le \bar{X}_n+t_{\alpha/2}(n-1)\dfrac{\sigma}{\sqrt{n}} \right] \\[15pt] =1&-\alpha \end{aligned} P = P = 1 [ − t α / 2 ( n − 1 ) ≤ S n n ( X ˉ n − μ ) ≤ t α / 2 ( n − 1 ) ] [ X ˉ n − t α / 2 ( n − 1 ) n σ ≤ μ ≤ X ˉ n + t α / 2 ( n − 1 ) n σ ] − α
\\[20pt]
신뢰구간은 x ˉ n \bar{x}_n x ˉ n 에 대해 대칭이며, 길이는 모분산 σ 2 \sigma^2 σ 2 이 작을수록 또 표본의 크기 n n n 이 커질수록 짧아짐을 볼 수 있다.
\\[30pt]
정규분포의 모분산에 대한 신뢰구간
모평균이 알려진 경우
∑ i = 1 n ( X i − μ ) / σ 2 \sum_{i=1}^{n}(X_i-\mu)/\sigma^2 ∑ i = 1 n ( X i − μ ) / σ 2 이 자유도가 ( n ) (n) ( n ) 인 카이제곱 분포를 따르는 추축변량인 점에 근거하여 다음과 같이 구한다.
P [ χ 1 − α / 2 2 ( n ) ≤ n ( X ˉ n − μ ) σ 2 ≤ χ α / 2 2 ( n ) ] = P [ ∑ i = 1 n ( X ˉ i − μ 2 ) χ α / 2 2 ( n ) ≤ σ 2 ≤ ∑ i = 1 n ( X ˉ i − μ 2 ) χ 1 − α / 2 2 ( n ) ] = 1 − α \begin{aligned} P&\left[\chi^2_{1-\alpha/2}(n)\le \dfrac{\sqrt{n}(\bar{X}_n-\mu)}{\sigma^2}\le \chi^2_{\alpha/2}(n)\right] \\[15pt] =P&\left[\dfrac{\sum_{i=1}^{n}(\bar{X}_i-\mu^2)}{\chi^2_{\alpha/2}(n)} \le \sigma^2 \le \dfrac{\sum_{i=1}^{n}(\bar{X}_i-\mu^2)}{\chi^2_{1-\alpha/2}(n)} \right] \\[15pt] =1&-\alpha \end{aligned} P = P = 1 [ χ 1 − α / 2 2 ( n ) ≤ σ 2 n ( X ˉ n − μ ) ≤ χ α / 2 2 ( n ) ] [ χ α / 2 2 ( n ) ∑ i = 1 n ( X ˉ i − μ 2 ) ≤ σ 2 ≤ χ 1 − α / 2 2 ( n ) ∑ i = 1 n ( X ˉ i − μ 2 ) ] − α
\\[30pt]
모평균이 알려져 있지 않은 경우
μ \mu μ 를 표본평균 X ˉ n \bar{X}_n X ˉ n 로 추정한 통계량 ( n − 1 ) S n 2 / σ 2 = ∑ i = 1 n ( X i − X ˉ n ) / σ 2 (n-1)S_n^2/\sigma^2=\sum_{i=1}^{n}(X_i-\bar{X}_n)/\sigma^2 ( n − 1 ) S n 2 / σ 2 = ∑ i = 1 n ( X i − X ˉ n ) / σ 2 이 자유도가 ( n − 1 ) (n-1) ( n − 1 ) 인 카이제곱 분포를 따르는 추축변량인 점에 근거하여 다음과 같이 구한다.
P [ χ 1 − α / 2 2 ( n − 1 ) ≤ n ( X ˉ n − X ˉ n ) σ 2 ≤ χ α / 2 2 ( n − 1 ) ] = P [ ∑ i = 1 n ( X ˉ i − X ˉ n 2 ) χ α / 2 2 ( n − 1 ) ≤ σ 2 ≤ ∑ i = 1 n ( X ˉ i − X ˉ n 2 ) χ 1 − α / 2 2 ( n − 1 ) ] = 1 − α \begin{aligned} P&\left[\chi^2_{1-\alpha/2}(n-1)\le \dfrac{\sqrt{n}(\bar{X}_n-\bar{X}_n)}{\sigma^2}\le \chi^2_{\alpha/2}(n-1)\right] \\[15pt] =P&\left[\dfrac{\sum_{i=1}^{n}(\bar{X}_i-\bar{X}_n^2)}{\chi^2_{\alpha/2}(n-1)} \le \sigma^2 \le \dfrac{\sum_{i=1}^{n}(\bar{X}_i-\bar{X}_n^2)}{\chi^2_{1-\alpha/2}(n-1)} \right] \\[15pt] =1&-\alpha \end{aligned} P = P = 1 [ χ 1 − α / 2 2 ( n − 1 ) ≤ σ 2 n ( X ˉ n − X ˉ n ) ≤ χ α / 2 2 ( n − 1 ) ] [ χ α / 2 2 ( n − 1 ) ∑ i = 1 n ( X ˉ i − X ˉ n 2 ) ≤ σ 2 ≤ χ 1 − α / 2 2 ( n − 1 ) ∑ i = 1 n ( X ˉ i − X ˉ n 2 ) ] − α
두 정규분포의 모평균에 대한 신뢰구간, 두 정규분포의 모분산의 비에 대한 신뢰구간 과정은 본문 p.243참고.
\\[30pt]
근사신뢰구간
앞에서 다루어진 신뢰구간은 모분포의 정규성을 전제로 하였다. 그러나 모분포가 정규분포를 따르지 않더라도 중심극한정리를 사용하여 모수에 대한 신뢰구간을 근사적으로 다음과 같이 구할 수 있다.
랜덤표본 X 1 , X 2 , … , X n X_1,X_2,\ldots,X_n X 1 , X 2 , … , X n 의 분포의 평균과 분산이 각각 μ , σ 2 \mu,\sigma^2 μ , σ 2 이라고 할 때 모평균 μ \mu μ 에 대한 신뢰구간을 고려해보자. (정규분포 아님)
표본분산의 제곱근인 s n s_n s n 이 σ \sigma σ 로 수렴한다는 사실 (예 4.43)
중심극한정리
슬럿츠키의 정리 (정리 3.15)
에 의해 표본의 크기가 커짐에 따라
Z n = n ( X ˉ n − μ ) S n Z_n=\dfrac{\sqrt{n}(\bar{X}_n-\mu)}{S_n} Z n = S n n ( X ˉ n − μ )
의 분포는 표준 정규분포 N ( 0 , 1 ) N(0,1) N ( 0 , 1 ) 로 수렴한다. 따라서 이를 활용한 신뢰계수가 1 − α 1-\alpha 1 − α 인 모평균 μ \mu μ 에 대한 근사신뢰구간은
P [ − z α / 2 ≤ Z n ≤ z α / 2 ] = P [ X ˉ n − z α / 2 S n n ≤ μ ≤ X ˉ n + z α / 2 S n n ] ≒ 1 − α \begin{aligned} P&\left[-z_{\alpha/2}\le Z_n\le z_{\alpha/2}\right] \\[15pt] =P&\left[\bar{X}_n-z_{\alpha/2}\dfrac{S_n}{\sqrt{n}} \le \mu\le \bar{X}_n+z_{\alpha/2}\dfrac{S_n}{\sqrt{n}} \right] \\[15pt] \fallingdotseq1&-\alpha \end{aligned} P = P ≒ 1 [ − z α / 2 ≤ Z n ≤ z α / 2 ] [ X ˉ n − z α / 2 n S n ≤ μ ≤ X ˉ n + z α / 2 n S n ] − α
으로 주어진다. 모분산이 알려진 경우에는 S n S_n S n 대신 σ \sigma σ 를 사용.
\\[30pt]
예 4.47
모분포가 포아송 ( λ ) (\lambda) ( λ ) 일 때 랜덤표본 X 1 , X 2 , … , X n X_1,X_2,\ldots,X_n X 1 , X 2 , … , X n 에 근거하여 모평균 λ \lambda λ 에 대한 95% 근사신뢰구간을 구해보자.
[풀이]
표본의 크기가 커질 때 대수의 법칙에 따라 표본평균 X ˉ n \bar{X}_n X ˉ n 는 λ \lambda λ 에 확률적으로 수렴하고 중심극한정리에 따라
n ( X ˉ n − λ ) λ → d N ( 0 , 1 ) \dfrac{\sqrt{n}(\bar{X}_n-\lambda)}{\sqrt{\lambda}}\xrightarrow{d} N(0,1) λ n ( X ˉ n − λ ) d N ( 0 , 1 )
이므로 슬럿츠키 정리에 의해
Z n = n ( X ˉ n − λ ) X ˉ n → d N ( 0 , 1 ) Z_n=\dfrac{\sqrt{n}(\bar{X}_n-\lambda)}{\sqrt{\bar{X}_n}}\xrightarrow{d} N(0,1) Z n = X ˉ n n ( X ˉ n − λ ) d N ( 0 , 1 )
로 수렴한다. 따라서 모수 λ \lambda λ 에 대한 95%의 근사신뢰구간을 다음과 같이 구할 수 있다.
[ X ˉ n − 1.96 X ˉ n , X ˉ n + 1.96 X ˉ n ] \left[\bar{X}_n-1.96\sqrt{\dfrac{\bar{X}}{n}} , \bar{X}_n+1.96\sqrt{\dfrac{\bar{X}}{n}}\right] \\[15pt] [ X ˉ n − 1 . 9 6 n X ˉ , X ˉ n + 1 . 9 6 n X ˉ ]
\\[30pt]
예 4.48
X 1 , X 2 , … , X n X_1,X_2,\ldots,X_n X 1 , X 2 , … , X n 이 베르누이( p ) (p) ( p ) 로부터의 랜덤표본일 때, 모수 p p p 에 대한 신뢰구간을 중심극한정리를 이용하여 다음과 같이 근사적으로 구할 수 있다. p ^ = X ˉ n \hat{p}=\bar{X}_n p ^ = X ˉ n 으로 추정하면(이는 최대가능도 추정량임) p ^ → p p \hat{p}\xrightarrow{p}p p ^ p p 이고
p ^ − p p ( 1 − p ) / n → d N ( 0 , 1 ) \dfrac{\hat{p}-p}{\sqrt{p(1-p)/n}}\xrightarrow{d} N(0,1) p ( 1 − p ) / n p ^ − p d N ( 0 , 1 )
으로 분포수렴하므로, 슬럿츠키의 정리에 의해 다음이 성립한다.
p ^ − p p ^ ( 1 − p ^ ) / n → d N ( 0 , 1 ) \dfrac{\hat{p}-p}{\sqrt{\hat{p}(1-\hat{p})/n}}\xrightarrow{d} N(0,1) p ^ ( 1 − p ^ ) / n p ^ − p d N ( 0 , 1 )
따라서 모수 p p p 에 대한 100 ( 1 − α ) % 100(1-\alpha)\% 1 0 0 ( 1 − α ) % 의 근사신뢰구간을 다음과 같이 구할 수 있다.
[ p ^ ± Z α / 2 p ^ ( 1 − p ^ ) / n ] \left[\hat{p} \pm Z_{\alpha/2}\sqrt{\hat{p}(1-\hat{p})/n} \right] \\[15pt] [ p ^ ± Z α / 2 p ^ ( 1 − p ^ ) / n ]
두 독립인 랜덤표본의 근사신뢰구간, 표본크기는 p.246-249 참조
[참고문헌]