표본통계량
ttest_1sample
from scipy.stats import ttest_1sample
from scipy.stats import Levene
Levene
검정이 필요함.equal_var = False
)from scipy.stats import ttest_ind
: 독립이므로 키워드 ind가 들어감.math
: sqrt 쓰려고 넣는데, 사실 그냥 ** 0.5해도 충분...
from scipy.stats import Levene
from scipy.stats import ttest_ind
실험 전/후 측정 값의 차이가 정규성을 따르고 있어야 함.
- 이 차이 값이 유의한지 T 검정을 해야 함.
둘 사이에 관계가 있으므로 ttest_rel
. 키워드는 rel
.
from scipy.stats import ttest_rel
해당 메소드의 주요 파라미터로 alternative
가 있는데, 귀무가설과 대립가설 간의 방향성을 설정하는 파라미터임.
- 파라미터의 내용은 아래와 같음.
1. two-sided
: 양측 검정
2. less
: 귀무가설 내용이 작은 것일 때 (a는 b보다 작나?)
3. greater
: 귀무가설 내용이 큰 것일 때 (b는 a보다 작나?)
각 실험단위를 동질적인 쌍으로 묶은 다음, 각 쌍에서 관측값의 차를 이용해 두 모평균의차에 대한 추론 문제를 다룰 수 있음.
- 실험 이전 집단과 실험 이후 집단이 같을 때 사용하는 검정으로 쌍체 비교, 대응비교라고 함.
표본 크기가 크면 검정통계량의 값은 표본정규분포를 따름.
다른 말로 적합도 검정이라고도 한다.
기대빈도 즉, expected
리스트를 구해서 검정하는 방식.
사용하는 패키지는 카이제곱 진짜, 카이스퀘어 = chisquare
from scipy.stats import chisquare
f_oneway
를 사용함 : oneway
가 키워드from scipy.stats import f_oneway
귀무가설은 두 모분산의 비가 같다이고, 대립가설은 다르다
.임.적합도 검정
- 관측도수가 우리가 가정하는 이론상의 분포를 잘 따른다는 귀무가설을 검정하는 것
- 관측도수 : 실제 시험에서 단일 특성에 의해 분류된 각 범주의 관측 값을 의미
- 관측도수가 얼마나 이론상의 분포, 주어진 형태를 잘 따르는지 검정하는 가설 검정 기법
원래 값을 그룹별로 나눈 후, 각 그룹별로 그 기대하는 비율을 곱해주는 것이 키 포인트
사용하는 패키지는 카이제곱 진짜, 카이스퀘어 = chisquare
from scipy.stats import chisquare
chi2_contingency
, contingency = 우연성이라는 의미임.
from scipy.stats import chi2_contingency
crosstab
사용하는 검정