신뢰구간이란, 통계적 추론을 통해 예측되는 범위 즉, 시행한 가설검정이 통계적 의미를 갖는 범위를 말한다.
공식: xˉ±t⋅ns
(X'은 평균, t⋅ns 는 error를 의미한다.)
신뢰도 : 신뢰도가 95% 라는 의미는 표본을 100번 뽑았을때 95번은 신뢰구간 내에 모집단의 평균이 포함된다.
신뢰구간과 T-test의 관계
귀무가설 : 모집단의 평균값은 표본평균 값일 것이다.(2-tailed test기준)
모집단의 평균이 표본평균으로부터 계산된 신뢰구간 안에 들어가는 경우, 귀무가설을 기각하지 않는다.
모집단의 평균이 표본평균으로부터 계산된 신뢰구간 밖으로 나가는 경우, 귀무가설을 기각한다.
✍ANOVA✍
2개 이상 그룹의 평균에 차이가 있는지에 대한 가설검정방법이다.
multiple comparision
2개 이상의 그룹들을 비교하기 위해서 각각의 그룹중 2개씩 ttest를 진행하려는 방식으로
이론상으로는 가능하지만 n개의 가설검정중 적어도 하나에서 에러가 날 확률은 1-(1-a)^n 으로
여러개를 하나하나씩 비교하는 것은 그룹수가 늘어날수록 에러가 날 확률도 커진다는 것이다.
Variation
여러 그룹간의 차이가 있는지를 확인하기 위해선 여러 그룹들이 하나의 분포에서부터 왔다는 가정이 나온다. 이를 위한 지표는 F-stastic이다.
F=Variance−with−in−groupVariance−between−group
(F값이 높으면 다른 그룹끼리의 분산이 크고 전체그룹의 분산은 작다. 즉, 다른 그룹끼리의 분포가 다르다는 것을 뜻한다.)