[통계] 가설검정

GROOTY·2023년 5월 3일
0

가설 검정

어떤 추측, 가설에 대한 타당성 조사

대립가설(Ha or H1....) : 모집단에 새롭게 제시된 의견 또는 주장,

실제로 모집단을 이용할 수 없어 표본을 이용해서 입증하고자 하는 가설
귀무가설에 대립되는 설로 새롭게 검정하고자 하는 주장이다.
(귀무가설에 반하는 새로운 의견)
적극적으로 입증하고자 하는 주장이다

귀무가설(H0) : 대립가설과 반대되는 가설

현재의 정설(가설)로 관습적, 보수적 주장 (증명 할 필요가 없다)
두 통계치 간에 차이가 없다는 가설
새 가설에 의해 대체될 것을 예상하는 가설

구체적 신뢰구간 : 90%, 95%, 99%

데이터에 따라 구체적 신뢰구간이 다르다. 별도 신뢰구간 언급이 없다면 95%을 기준으로한다.
해당 신뢰구간에 맞춰 유의 수준(알파)은 0.1, 0.05, 0.01 이다. (지지정도값)

유의확률(p-value)

귀무가설을 기각할 수 있는 최소한의 확률
자유도를 고려했을 때 검정통계량에 대한 확률을 말한다. (귀무가설의 신뢰구간을 벗어나는 확률)
기각역보다 유의확률이 작아야 귀무가설을 기각할 수 있다.

방법1) 유의확률(p-value) 통한 방법
유의수준 (0.05) 보다 p-value 가 작다면 귀무기각
(유의수준 > p-value = 귀무기각)
유의수준 (0.05) 보다 p-value 가 크다면 귀무채택
(유의수준 < p-value = 귀무채택)
방법2) 검정통계량을 통한 방법
카이제곱 검정, T검정 등 분석방법으로 임계치에 들어오는지 확인

통계적 오류

출처 : https://drhongdatanote.tistory.com/76

  • 1종 오류
    귀무가설이 실제로는 참이어서 채택해야 함에도 불구하고 표본의 오차때문에 이를 채택하지 않는 오류를 말합니다.

  • 2종 오류
    귀무가설이 거짓이라서 채택하지 말아야 하는데 표본의 오차 때문에 이를 채택하는 오류를 말합니다.

profile
개발 시작

0개의 댓글