자유도 n 아니면 n-1

Kiwoong Park·2022년 2월 4일
0

자유도 : 독립변수의 개수

if x+y+z=10 에서 자유도가 독립변수라면 3개 처럼보이나 실제는 2개로 그 이유는, x와 y가 결정이 되면 z는 자동으로 결정되기 때문임.

표본통계량 = 추정량

평균과 분산 μσ2\mu 와 \sigma^2 (모수=parameter)인 모집단에서 크기 n인 표본1 = {x1,x2,...,xn}\{x_1, x_2, ..., x_n\} 의 평균과 분산은 각각 xˉ,S2\bar{x}, S^2 을 표본통계량 = 추정량

표본평균의 기대값 = 모집단의 평균 => 불편추정량

표본의 평균은 다음 수식과 같고, xˉ=i=1nxn\bar{x} = \cfrac{\sum_{i=1}^{n}x}{n}
표본들(표본1, 표본2, 표본3 ...) 의 기대값은 모집단의 평균과 같다고 가정하면, E(xˉ)=μE(\bar{x})=\mu
즉, 추정량의 기대값 = 모수이고 이때의 추정량을 불편추정량이라고 함
편의 = 추정량의 기대값 - 모수 = 0이므로 불편추정량(unbiased estimator)

분산은 불편 추정량?

표본의 분산은 S2=i=1n(xixˉ)2nS^2 = \cfrac{\sum_{i=1}^{n}(x_i-\bar{x})^2}{n} 이고
이때 표본 분산의 기대값은 모집단의 분산과 같지 않음
E(S2)σ2E(S^2) \neq \sigma^2 => 불편 추정량이 아님!

표본 분산 계산식에서 n>n1n->n-1을 하였더니 모집단의 분산과 같아짐
S2=i=1n(xixˉ)2n1S^2 = \cfrac{\sum_{i=1}^{n}(x_i-\bar{x})^2}{n-1}
표본분산을 불편추정량으로 만들기 위해 n 대신 n-1을 사용

표본 분산의 자유도는 n? n-1?

얼핏보면 S2=i=1n(xixˉ)2n1S^2 = \cfrac{\sum_{i=1}^{n}(x_i-\bar{x})^2}{n-1} 이 식에서 자유도는 독립변수 x의 개수인 n인 것 같지만,
(x1xˉ)+(x2xˉ)+...+(xnxˉ)=0(x_1-\bar{x})+(x_2-\bar{x})+ ... + (x_n-\bar{x})=0 이 되므로 xi부터xn1x_i 부터 x_{n-1}까지만 알면 xnx_n은 종속적으로 계산됨, 즉 자유도는 표본분산의 자유도는 n-1

분산은 원래 n으로 나누는건데 표본분산을 불편추정량으로 만들어주기 위해서 n-1로 나눠줌 => 그러고 확인을 하니 n-1은 표본분산의 자유도가 됨

profile
You matter, never give up

0개의 댓글