Confidence Interval(신뢰구간), ANOVA

yoyoyong·2021년 7월 28일

통계

목록 보기
4/5

✍신뢰구간✍

신뢰구간이란, 통계적 추론을 통해 예측되는 범위 즉, 시행한 가설검정이 통계적 의미를 갖는 범위를 말한다.

  • 공식: xˉ±tsn\bar {x} \pm {t \cdot {s \over \sqrt{n} } }
    (X'은 평균, tsn{t \cdot {s \over \sqrt{n} } } 는 error를 의미한다.)
  • 신뢰도 : 신뢰도가 95% 라는 의미는 표본을 100번 뽑았을때 95번은 신뢰구간 내에 모집단의 평균이 포함된다.
  • 신뢰구간과 T-test의 관계
    귀무가설 : 모집단의 평균값은 표본평균 값일 것이다.(2-tailed test기준)
    모집단의 평균이 표본평균으로부터 계산된 신뢰구간 안에 들어가는 경우, 귀무가설을 기각하지 않는다.
    모집단의 평균이 표본평균으로부터 계산된 신뢰구간 밖으로 나가는 경우, 귀무가설을 기각한다.

✍ANOVA✍

2개 이상 그룹의 평균에 차이가 있는지에 대한 가설검정방법이다.

  • multiple comparision
    2개 이상의 그룹들을 비교하기 위해서 각각의 그룹중 2개씩 ttest를 진행하려는 방식으로
    이론상으로는 가능하지만 n개의 가설검정중 적어도 하나에서 에러가 날 확률은 1-(1-a)^n 으로
    여러개를 하나하나씩 비교하는 것은 그룹수가 늘어날수록 에러가 날 확률도 커진다는 것이다.
  • Variation
    여러 그룹간의 차이가 있는지를 확인하기 위해선 여러 그룹들이 하나의 분포에서부터 왔다는 가정이 나온다. 이를 위한 지표는 F-stastic이다.

F=VariancebetweengroupVariancewithingroupF = { {Variance-between-group} \over {Variance-with-in-group} }

(F값이 높으면 다른 그룹끼리의 분산이 크고 전체그룹의 분산은 작다. 즉, 다른 그룹끼리의 분포가 다르다는 것을 뜻한다.)

0개의 댓글