표본평균, 분산들의 기대값과 모평균, 모분산이 같나?

Kiwoong Park·2022년 2월 4일
0

표본평균과 표본평균들의 기대값

평균과 분산 μσ2\mu 와 \sigma^2 (모수=parameter)인 모집단에서 크기 n인 표본을 복원 추출하여 뽑았다고 해보자.
이때 표본1 = {x1(1),x2(1),...,xn(1)}\{x^{(1)}_1, x^{(1)}_2, ..., x^{(1)}_n\} 의 평균과 분산을 각각 x1ˉ,S12\bar{x_1}, S_1^2 이라고 하고,
표본2 의 평균과 분산은 x2ˉ,S22\bar{x_2}, S_2^2
표본 3, 4 ..., k, ... 등이 있을 때,
각 표본의 첫번째 원소를 대표하는 변수를 x1x_1, 두번째 원소를 대표하는 변수를 x2x_2, 각 표본의 평균을 대표하는 변수를 xˉ\bar{x}라고 한다면
xˉ=i=1nxin\bar{x} = \cfrac{\sum_{i=1}^{n}x_i}{n} 으로 표현할 수 있고,
이때 xˉ={x1ˉ,x2ˉ,...,xkˉ,...}\bar{x} = \{\bar{x_1}, \bar{x_2}, ..., \bar{x_k}, ...\}
x1={x1(1),x2(1),...,xk(1),...}x_1=\{x^{(1)}_1, x^{(1)}_2, ..., x^{(1)}_k, ...\}
x2={x1(2),x2(2),...,xk(2),...}x_2=\{x^{(2)}_1, x^{(2)}_2, ..., x^{(2)}_k, ...\}

이때 각 표본평균들의 기대값 E(xˉ)=limkx1ˉ+x2ˉ+...xkˉkE(\bar{x}) = \lim_{k\rarr\infin}\cfrac{\bar{x_1}+\bar{x_2}+...\bar{x_k}}{k}
로 표현할 수 있고 그렇다면
E(xˉ)=E(i=1nxin)=1nE(x1+x2+x3+...xn)=1nE(x1)+E(x2)+...+E(xn)E(\bar{x}) = E(\cfrac{\sum_{i=1}^{n}x_i}{n})\\ = \cfrac{1}{n}E(x_1+x_2+x_3+ ... x_n) \\ = \cfrac{1}{n}{E(x_1)+E(x_2)+ ... + E(x_n)}
로 표현할 수 있음.

첫번째를 표현하는 집합의 기대값 = 크기가 1인 표본의 집합의 기대값 \rarr 모평균

여기서 E(x1),E(x2),E(x3)E(x_1), E(x_2), E(x_3)의 각각의 의미는 각 표본에서 첫번째 원소들의 기대값, 다시말하면 크기가 1인 표본의 집합의 기대값이므로 큰수의 법칙에 따라 모집단의 평균(μ\mu)과 같으므로
1nE(x1)+E(x2)+...+E(xn)=μnn=μ\cfrac{1}{n}{E(x_1)+E(x_2)+ ... + E(x_n)} = \cfrac{\mu n}{n} = \mu가 되며
결과적으로 표본평균들의 기대값은 모평균과 같다고 할 수 있다.

표본분산과 표본분산들의 기대값

표본1 = {x1(1),x2(1),...,xn(1)}\{x^{(1)}_1, x^{(1)}_2, ..., x^{(1)}_n\} 의 분산은
S12=i=1n(xi(1)x1ˉ)2nS_1^2 = \cfrac{\sum_{i=1}^n(x_i^{(1)}-\bar{x_1})^2}{n},
표본2 = {x1(2),x2(2),...,xn(2)}\{x^{(2)}_1, x^{(2)}_2, ..., x^{(2)}_n\} 의 분산은
S22=i=1n(xi(2)x2ˉ)2nS_2^2 = \cfrac{\sum_{i=1}^n(x_i^{(2)}-\bar{x_2})^2}{n},
표본k = {x1(k),x2(k),...,xn(k)}\{x^{(k)}_1, x^{(k)}_2, ..., x^{(k)}_n\} 의 분산은
Sk2=i=1n(xi(k)xkˉ)2nS_k^2 = \cfrac{\sum_{i=1}^n(x_i^{(k)}-\bar{x_k})^2}{n}

표본분산을 변수 형태로 표현하여
S2=i=1n(xixˉ)2n1S^2 = \cfrac{\sum_{i=1}^n(x_i-\bar{x})^2}{n-1},
여기서 n-1로 나눠야 불편추정량이됨 -> 이후 증명

표본분산의 기대값은,
E(S2)=E(i=1n(xixˉ)2n1)E(S^2) = E(\cfrac{\sum_{i=1}^n(x_i-\bar{x})^2}{n-1})
=1n1E(i=1n(xixˉ)2)=\cfrac{1}{n-1}E(\sum_{i=1}^n(x_i-\bar{x})^2)
=1n1E(i=1n(xiμ+μxˉ)2)=\cfrac{1}{n-1}E(\sum_{i=1}^n(x_i-\mu+\mu-\bar{x})^2)
=1n1E[i=1n{(xiμ)2+2(xiμ)(μxˉ)+(μxˉ)2}]=\cfrac{1}{n-1}E[\sum_{i=1}^n \{(x_i-\mu)^2 + 2(x_i-\mu)(\mu-\bar{x})+(\mu-\bar{x})^2\}]
=1n1E[i=1n(xiμ)2+2(μxˉ)i=1n(xiμ)+n(μxˉ)2]=\cfrac{1}{n-1}E[\sum_{i=1}^n(x_i-\mu)^2 + 2(\mu-\bar{x})\sum_{i=1}^n(x_i-\mu)+n(\mu-\bar{x})^2]
=1n1E[i=1n(xiμ)2+2n(μxˉ)2+n(μxˉ)2],=\cfrac{1}{n-1}E[\sum_{i=1}^n(x_i-\mu)^2 + 2n(\mu-\bar{x})^2+n(\mu-\bar{x})^2],
wherei=1n(xiμ)=nxˉnμwhere \sum_{i=1}^n(x_i-\mu) = n\bar{x}-n\mu
=1n1E[i=1n(xiμ)2n(xˉμ)2]=\cfrac{1}{n-1}E[\sum_{i=1}^n(x_i-\mu)^2 - n(\bar{x}-\mu)^2]
=1n1[E(i=1n(xiμ)2)nE((xˉμ)2)]=\cfrac{1}{n-1}[E(\sum_{i=1}^n(x_i-\mu)^2) - nE((\bar{x}-\mu)^2)],
이때 뒤의 항의 의미는 표본평균-모평균의 차이의 제곱에 기대값으로 표본평균의 분산으로 얘기할 수 있고, 이는σ2n\cfrac{\sigma^2}{n} 으로 표현할 수 있다(중심극한 정리).
그리고 앞의 항에서 xix_i 즉, x1,x2x_1, x_2는 크기가 1인 표본이고, 크기가 1인 표본평균의 분산으로 얘기할 수 있다. nσ2\rarr n\sigma^2으로 큰 수의 법칙에 의해 표현할 수 있다.
결과적으로,
=1n1(nσ2σ2)=1n1(n1)σ2=E(S2)=\cfrac{1}{n-1}(n\sigma^2-\sigma^2) \\ =\cfrac{1}{n-1}(n-1)\sigma^2 = E(S^2)
결국 표본분산의 기대값이 모분산과 같아짐을 알 수 있고, 여기서 자유도가 n-1이 아닌 n이었다면 표본분산의 기대값이 모분산의 기대값보다 커져서 모분산을 과소평가하게 된다.

profile
You matter, never give up

0개의 댓글