충분통계량의 정의와 예시

STATS·2023년 8월 15일
0

수리통계학

목록 보기
39/40

충분통계량

X=(X1,...,Xn)X = (X_1, ..., X_n)의 결합 확률밀도함수가 f(x1,...,xn;θ1,...θk)f(x_1, ..., x_n; \theta_1, ... \theta_k)일 때, S(X)=(S1(X),...,Sl(X))S(X) = (S_1(X), ..., S_l(X))ll개의 통계량 벡터라고 하자.

이 때 조건부 확률변수 (X1,...,XnS(X))(X_1, ..., X_n | S(X))의 분포가 θ=(θ1,...,θk)\theta = (\theta_1, ..., \theta_k)의존하지 않으면 S(X)S(X)를 결합충분통계량이라고 한다. l=1l= 1인 경우는 S(X)S(X)θ\theta충분통계량이라고 한다.

충분통계량은 표본과 동일한 모수에 대한 정보를 가지고 있는 통계량(벡터)를 의미한다. 따라서 충분통계량이 주어지면 표본은 모수에 대한 아무런 정보도 가지지 않으므로, 위의 경우에서 (X1,...,XnS(X))(X_1, ..., X_n|S(X))의 피셔 정보량은 S(X)S(X)가 충분통계량이기 때문에 0이 된다.

우리는 표본이 모수에 대한 정보를 가지고 있기 때문에 이를 이용해 모수를 추정하는 것인데 충분통계량이 주어지면 더 이상 표본을 모수 추정에 사용할 이유가 없어진다. 따라서 충분통계량을 표본 대신 이용해도 동일한 모수 추정의 효과를 보이는 것이다. 충분통계량의 크기가 원래 표본보다 작은 경우, 모수 추정에 있어서 자료의 축소 효과를 낼 수 있다.

충분통계량의 예시

베르누이 분포

X1,...,XnX_1, ..., X_nBer(p)Ber(p)의 랜덤 표본이라고 하자. 이 때 S=i=1nXiS = \sum_{i=1}^n X_ipp의 충분통계량임을 보이자.

f(x1,...,xns)=P(X1=x1,...,Xn=xn,S=s)P(S=s)=P(X1=x1,...,Xn=xn)P(S=s), s=i=1nxi=ps(1p)ns(ns)ps(1p)ns=1(ns),s=i=1nxif(x1,...,xns)=1(ns),s=i=1nf(x_1, ..., x_n | s) = \frac{P(X_1 = x_1, ..., X_n = x_n, S = s)}{P(S = s)} \\ = \frac{P(X_1= x_1, ..., X_n = x_n)}{P(S=s)}, \ s = \sum_{i=1}^n x_i = \frac{p^s(1-p)^{n-s}}{\binom{n}{s}p^s(1-p)^{n-s}} = \frac{1}{\binom{n}{s}}, s = \sum_{i=1}^n x_i \\ {} \\ \therefore f(x_1, ..., x_n|s) = \frac{1}{\binom{n}{s}}, s = \sum_{i=1}^n

따라서 확률변수 X1,...,XnSX_1, ..., X_n | S는 모수 pp에 의존하지 않으므로 SSpp에 대한 충분통계량이다.

정규분포

X1,...,XnX_1, ..., X_nN(θ,σ2)N(\theta, \sigma^2)의 랜덤 표본이라고 하자. 이 때 Xˉ=i=1nXin\bar{X} = \frac{\sum_{i=1}^n X_i}{n}θ\theta의 충분통계량임을 보이자.

f(x1,...,xns)=f(x1,...,xn)fS(s)=i=1nfXi(xi)fS(s)=i=1n1σ2πe(xiθ)22σ21σ2πen(sθ)22σ2=(1σ2π)ne12σ2i=1n(xiθ)21σ2πen(sθ)22σ2=(1σ2π)n1e12σ2[i=1n(xiθ)2n(sθ)2]=(1σ2π)n1e12σ2[i=1n(xixˉ)2]f(x1,...,xns)=(1σ2π)n1e12σ2[i=1n(xixˉ)2]f(x_1, ..., x_n|s) = \frac{f(x_1, ..., x_n)}{f_S(s)} = \frac{\prod_{i=1}^n f_{X_i}(x_i)}{f_S(s)} = \frac{\prod_{i=1}^n \frac{1}{\sigma \sqrt{2 \pi}}e^{-\frac{(x_i - \theta)^2}{2\sigma^2}}}{\frac{1}{\sigma \sqrt{2 \pi}}e^{-\frac{n(s-\theta)^2}{2\sigma^2}}} \\ = \frac{\left( \frac{1}{\sigma \sqrt{2 \pi}}\right)^ne^{-\frac{1}{2\sigma^2}\sum_{i=1}^n (x_i - \theta)^2}}{\frac{1}{\sigma \sqrt{2 \pi}}e^{-\frac{n(s-\theta)^2}{2\sigma^2}}} = (\frac{1}{\sigma \sqrt{2 \pi}})^{n-1}e^{-\frac{1}{2 \sigma^2}\left[\sum_{i=1}^n (x_i -\theta)^2 - n(s - \theta)^2\right]} \\ = (\frac{1}{\sigma \sqrt{2 \pi}})^{n-1}e^{-\frac{1}{2 \sigma^2}\left[\sum_{i=1}^n (x_i - \bar{x})^2\right]} \\ {} \\ \therefore f(x_1, ..., x_n|s) =(\frac{1}{\sigma \sqrt{2 \pi}})^{n-1}e^{-\frac{1}{2 \sigma^2}\left[\sum_{i=1}^n (x_i - \bar{x})^2\right]}

따라서 확률변수 X1,...,XnSX_1, ..., X_n|S는 모수 θ\theta에 의존하지 않으므로 Xˉ\bar{X}θ\theta에 대한 충분통계량이다.

0개의 댓글