표준오차
추정치가 항상 정확할수 없기에 추정치가 모수에 얼마나 가까운지의 정확도를 측정하기위한 도구
자료의 수가 클수록 표준오차가 작아져서 정확한 추정이 가능
표준편차와 헷갈리면 안됨 : 표준편차는 모집단 내에서의 퍼진정도를 나타내고 표준오차는 표본통계량과 모수간의 오류의 가능성 정도를 나타낸 것임
신뢰수준이 같다면 길이가 더 짧은 구간이 더 좋다. 위에서도 나왔지만 추정의 정확성이 같다라고 가정되면 길이가 짧은게 더 좋은것이 논리적으로 옳다.
신뢰구간 구하기
"에 대한 신뢰구간"
~를 표준화하여 ~로하면
ex) 95%신뢰수준에서 신뢰구간을 구하면
를 적용시켜
혹은 으로 나타냄
신뢰구간이 짧아질 조건
신뢰도가 낮을수록, 표본의 크기 n이 클수록, 표준편차가 작을수록 짧아진다.
신뢰구간의 의미
- ex. 95%신뢰구간 표본을 여러번 추출하였을때 이 구간 중 모평균을 포함하는 표본의 비율이 95%에 가까움
- 와 는 큰 차이가 있다.
먼저 확률변수 X의 경우 각 확률변수는 정해져 있지 않다. 따라서 표본에따라 그 표본에 맞게 신뢰구간이 계속바뀌고 우리는 이 구간에 가 있을확률이 라고 할 수있다.
표본평균 x의 경우 이미 정해져있는 값으로 이 구간에 가 포함되거나 포함되지 않거나 둘 중 하나이다. 따라서 이 구간에 가 있을 확률이 라는 것은 옳지 않다.
일반적으로 모집단은 분포나 표준편차가 알려져있지않다. 그럼 신뢰구간을 구할때 는 어떻게 하는가.
n이 충분히 클때 : 표본의 표준편차 는 의 값과 가까울 것이기에 대체하여 신뢰구간을 구한다. 즉,
로 하면된다.
먼저 허용오차라는 개념에 대해서 알아야한다. 통계는 항상 100% 정확할수없고 어느정도의 오차가 생기기마련이다. 하지만 우리가 이정도 오차까지의 허용은 괜찮다라고 말할수 있는 최대한의 범위가 허용오차인 것이다. 신뢰구간 또한 점추정에서의 허용오차라고 볼수도 있다.
굉장히 모순적인 말이지만 표본크기는 결국 많으면 많을수록 좋기에 허용오차와 관계없이 가능한 많은 표본을 뽑는 것이 중요하다.
표본이 제공하는 자료를 토대로 가설을 받아드릴지 기각할지를 검정하는 방법이다.
대립가설 :
귀무가설의 반대로 입증되기를 기다리는 가설
귀무가설이 기각되면 대립가설이 선택된다.
귀무가설( :
실제로 연구에서 검증하여야하는 가설
기본적으로 참으로 추정하며 이를 반박하기위해서는 근거가 필요함
귀무가설이 참이라면 귀무가설을 채택, 그렇지 않다면 기각
검정결과의 표현 :
귀무가설을 채택한경우 "귀무가설을 기각하지 못함"
대립가설을 채택한경우 "귀무가설을 기각"
모든 기준이 귀무가설임을 알 수 있음
검정통계량 : 가설검정에 이용되는 통계량
기각역 : 귀무가설을 기각하게되는 관측값의 영역
ex) 5kg이상 빼지못하면 다이어트 실패이고 귀무가설이 80 kg인 사람의 다이어트 실패라면 5kg이상빼면 귀무가설이 기각되기때문에 기각역은 가 된다.
제 1종 오류() : 귀무가설이 참일때, 귀무가설을 기각
제 2종 오류() : 대립가설이 참일때, 귀무가설을 기각하지못함
1종오류를 줄이려면 를 작게해야지만 2종오류를 줄이려면 를 크게해야함 따라서 적절하게 조정하여 기각역을 설정해야함
일반적으로 1종오류가 2종오류보다 심각함 귀무가설을 기각하지 못하는 2종오류의 경우에는 기존에 하던 방식을 그대로 진행하면 된다. 다만 이미 새로운 대안이 나왔음에도 그것을 채택하지 못하는 기회를 날리는 격이다. 하지만 1종오류의 경우 새로운 대안이 옳은 대안이 아님에도 불구하고 기존의 방식을 바꾸는 격이되기에 매우 위험한 오류라고 본다. 따라서 2종오류보다 1종오류에 더 초점을 맞추어야한다.