자유도 : 독립변수의 개수
if x+y+z=10
에서 자유도가 독립변수라면 3개 처럼보이나 실제는 2개로 그 이유는, x와 y
가 결정이 되면 z
는 자동으로 결정되기 때문임.
표본통계량 = 추정량
평균과 분산 μ와σ2 (모수=parameter)인 모집단에서 크기 n인 표본1 = {x1,x2,...,xn} 의 평균과 분산은 각각 xˉ,S2 을 표본통계량 = 추정량
표본평균의 기대값 = 모집단의 평균 => 불편추정량
표본의 평균은 다음 수식과 같고, xˉ=n∑i=1nx
표본들(표본1, 표본2, 표본3 ...) 의 기대값은 모집단의 평균과 같다고 가정하면, E(xˉ)=μ
즉, 추정량의 기대값 = 모수이고 이때의 추정량을 불편추정량이라고 함
편의 = 추정량의 기대값 - 모수 = 0이므로 불편추정량(unbiased estimator)
분산은 불편 추정량?
표본의 분산은 S2=n∑i=1n(xi−xˉ)2 이고
이때 표본 분산의 기대값은 모집단의 분산과 같지 않음
E(S2)=σ2 => 불편 추정량이 아님!
표본 분산 계산식에서 n−>n−1을 하였더니 모집단의 분산과 같아짐
S2=n−1∑i=1n(xi−xˉ)2
표본분산을 불편추정량으로 만들기 위해 n 대신 n-1을 사용
표본 분산의 자유도는 n? n-1?
얼핏보면 S2=n−1∑i=1n(xi−xˉ)2 이 식에서 자유도는 독립변수 x의 개수인 n인 것 같지만,
(x1−xˉ)+(x2−xˉ)+...+(xn−xˉ)=0 이 되므로 xi부터xn−1까지만 알면 xn은 종속적으로 계산됨, 즉 자유도는 표본분산의 자유도는 n-1
분산은 원래 n으로 나누는건데 표본분산을 불편추정량으로 만들어주기 위해서 n-1로 나눠줌 => 그러고 확인을 하니 n-1은 표본분산의 자유도가 됨