Day41

김재현·2023년 7월 17일

JUPYTER/DL/ML

목록 보기
18/73

복습

T-검정

귀무가설을 기각 후 대립가설 채택 여부를 확인하는 가설
p-value를 집중 확인

p-value의 기준

  • P-value < 0.01 : 귀무가설이 옳을 확률이 0.01 이하 → 틀렸다(깐깐한 기준) --> 귀무가설 기각, 대립가설 채택
  • P-value < 0.05 : 귀무가설이 옳을 확률이 0.05 이하 → 틀렸다(일반적인 기준) --> 귀무가설 기각, 대립가설 채택
  • 0.05 < P-value < 0.1 : 애매한 경우(샘플링을 다시한다)
  • 0.1 < P-value : 귀무가설이 옳을 확률이 0.1 이상 → 귀무가설 기각 불가, 틀리지 않았다(맞다와 다름)

진도

파이썬으로 신뢰구간 구하기

scipy.stats 패키지의 t 객체가 포함하는 interval(신뢰도, 자유도, loc=샘플평균, scale=샘플표준오차) 메서드를 사용한다.

파라미터설명
신뢰도95%, 90% 등을 0~1 범위 안에서 설정
자유도통계 모델의 매개변수나 관측치들이 얼마나 자유롭게 변할 수 있는지를 나타내는 값
일반적으로 전체데이터수1전체 데이터 수 - 1
샘플평균데이터들의 평균값
샘플표준오차데이터들의 표준오차 -> 표준편차샘플크기{표준편차 \over \sqrt{샘플크기}}

독립 표본 t-검정(이표본 검정, Independent two sample T-test)

서로 다른 두개의 그룹 간 평균의 차이가 유의미한지 여부를 판단
stats.ttest_ind


대응 표본 T-검정 (Paired T-test)

표본의 각 사례마다 대응하는 2개의 관측치를 통해 판단
한 집단에 어떤 작용이 가해졌을 때에 대한 before, after를 비교
stats.ttest_rel 사용

1개의 댓글

comment-user-thumbnail
2023년 7월 18일

글이 잘 정리되어 있네요. 감사합니다.

답글 달기