1) 연속형 데이터
2) 불연속성의 범주형 데이터: 두 변수들의 관계 확인 -> 카이제곱검정
from scipy.stats import ttest_1samp
import scipy.stats as stats
# 가설설정
null_hypothesis_mean =
# one-sample t-test 수행
t_statistic, p_value = stats.ttest_1samp(, null_hypothesis_mean)
사용하여 one-sample t-test 수행하였다. 이 때, 자유도는 n-1로 산정되었다.
# two-sample t-test 수행
t_statistic, p_value = stats.ttest_ind(S['A'], S['B'])
two-sample t-test는 one-sample과 다르게 가설을 설정하지 않고 두 변수간 차이를 비교하여 이루어졌다. 자유도도 n1+n2-2로 설정되었다.
from scipy.stats import chi2_contingency
사용하여 두 변수간 관계를 비교하였다.
여러 가설검증 방식을 배우며 데이터의 유형(연속형/범주형)을 구분하는 것이 데이터 분석에서 중요하다는 것에 대해 알게 되었고, 실제 데이터를 접할 때 이것이 어떤 유형인지 빠르게 파악할 수 있도록 하는 것이 중요하다는 생각이 들었다.