표본평균과 표본평균들의 기대값
평균과 분산 μ와σ2 (모수=parameter)인 모집단에서 크기 n인 표본을 복원 추출하여 뽑았다고 해보자.
이때 표본1 = {x1(1),x2(1),...,xn(1)} 의 평균과 분산을 각각 x1ˉ,S12 이라고 하고,
표본2 의 평균과 분산은 x2ˉ,S22
표본 3, 4 ..., k, ... 등이 있을 때,
각 표본의 첫번째 원소를 대표하는 변수를 x1, 두번째 원소를 대표하는 변수를 x2, 각 표본의 평균을 대표하는 변수를 xˉ라고 한다면
xˉ=n∑i=1nxi 으로 표현할 수 있고,
이때 xˉ={x1ˉ,x2ˉ,...,xkˉ,...}
x1={x1(1),x2(1),...,xk(1),...}
x2={x1(2),x2(2),...,xk(2),...}
이때 각 표본평균들의 기대값 E(xˉ)=limk→∞kx1ˉ+x2ˉ+...xkˉ
로 표현할 수 있고 그렇다면
E(xˉ)=E(n∑i=1nxi)=n1E(x1+x2+x3+...xn)=n1E(x1)+E(x2)+...+E(xn)
로 표현할 수 있음.
첫번째를 표현하는 집합의 기대값 = 크기가 1인 표본의 집합의 기대값 → 모평균
여기서 E(x1),E(x2),E(x3)의 각각의 의미는 각 표본에서 첫번째 원소들의 기대값, 다시말하면 크기가 1인 표본의 집합의 기대값이므로 큰수의 법칙에 따라 모집단의 평균(μ)과 같으므로
n1E(x1)+E(x2)+...+E(xn)=nμn=μ가 되며
결과적으로 표본평균들의 기대값은 모평균과 같다고 할 수 있다.
표본분산과 표본분산들의 기대값
표본1 = {x1(1),x2(1),...,xn(1)} 의 분산은
S12=n∑i=1n(xi(1)−x1ˉ)2,
표본2 = {x1(2),x2(2),...,xn(2)} 의 분산은
S22=n∑i=1n(xi(2)−x2ˉ)2,
표본k = {x1(k),x2(k),...,xn(k)} 의 분산은
Sk2=n∑i=1n(xi(k)−xkˉ)2
표본분산을 변수 형태로 표현하여
S2=n−1∑i=1n(xi−xˉ)2,
여기서 n-1로 나눠야 불편추정량이됨 -> 이후 증명
표본분산의 기대값은,
E(S2)=E(n−1∑i=1n(xi−xˉ)2)
=n−11E(∑i=1n(xi−xˉ)2)
=n−11E(∑i=1n(xi−μ+μ−xˉ)2)
=n−11E[∑i=1n{(xi−μ)2+2(xi−μ)(μ−xˉ)+(μ−xˉ)2}]
=n−11E[∑i=1n(xi−μ)2+2(μ−xˉ)∑i=1n(xi−μ)+n(μ−xˉ)2]
=n−11E[∑i=1n(xi−μ)2+2n(μ−xˉ)2+n(μ−xˉ)2],
where∑i=1n(xi−μ)=nxˉ−nμ
=n−11E[∑i=1n(xi−μ)2−n(xˉ−μ)2]
=n−11[E(∑i=1n(xi−μ)2)−nE((xˉ−μ)2)],
이때 뒤의 항의 의미는 표본평균-모평균의 차이의 제곱에 기대값으로 표본평균의 분산으로 얘기할 수 있고, 이는nσ2 으로 표현할 수 있다(중심극한 정리).
그리고 앞의 항에서 xi 즉, x1,x2는 크기가 1인 표본이고, 크기가 1인 표본평균의 분산으로 얘기할 수 있다. →nσ2으로 큰 수의 법칙에 의해 표현할 수 있다.
결과적으로,
=n−11(nσ2−σ2)=n−11(n−1)σ2=E(S2)
결국 표본분산의 기대값이 모분산과 같아짐을 알 수 있고, 여기서 자유도가 n-1이 아닌 n이었다면 표본분산의 기대값이 모분산의 기대값보다 커져서 모분산을 과소평가하게 된다.