두 집단의 평균을 비교하거나
하나의 집단의 평균을 특정 값과 비교하여 유의미한 차이가 있는지 확인
표본의 크기가 작거나, 모집단의 분산을 모를 때 사용
이 중 우리는 단일 표본 t-검정에 대해 알아볼 것이다.

t- 값이 클수록 두 평균의 차이가 큼을 얘기함.
귀무가설은 주로 차이가 없다거나 특별한 변화가 없다는 내용의 가설
즉, 어떤 새로운 현상이나 차이를 발견하지 못한다는 가정
통계적 검정에서는 보통 이 귀무가설을 검정하고, 데이터 분석 결과에 따라 귀무가설을 기각하거나 기각하지 못하는지를 결정 함
귀무가설을 설정:
데이터를 분석하기 전에, 우리는 먼저 귀무가설 설정
귀무가설은 보통 "차이가 없다" 또는 "특별한 변화가 없다"는 내용으로 설정
대립가설을 설정:
대립가설: 귀무가설이 틀렸을 경우에 대비한 반대되는 가설
대립가설은 보통 "차이가 있다" 또는 "특별한 변화가 있다"는 가정
데이터 분석 및 검정:
데이터를 분석하고, 이를 바탕으로 귀무가설을 기각할 수 있을지 판단
검정 결과 해석:
귀무가설을 기각할 수 있는지 판단할 때 사용하는 지표
p-value는 주어진 데이터가 귀무가설이 참일 때 관측된 통계치와 같거나 더 극단적인 결과가 나올 확률을 의미
문제: 다음은 22명의 학생들이 국어시험에서 받은 점수이다. 학생들의 평균이 75보다 크다고 할 수 있는가
검정통계량, p-value, 검정결과를 출력하시오
from scipy.stats import ttest_1samp
scores = [75, 80, 68, 72, 77, 82, 81, 79, 70, 74, 76, 78, 81, 73, 81, 78, 75, 72, 74, 79, 78, 79]
mu = 75 # 검정할 모평균
alpha = 0.05 # 유의 수준
t_statistic, p_value = ttest_1samp(scores, mu, alternative='greater')
print("t-statistic:", t_statistic)
print("p-value:", p_value)

if p_value < alpha:
print("귀무가설을 기각합니다. 모평균은 75보다 큽니다.")
else:
print("귀무가설을 채택합니다. 모평균은 75보다 크지 않습니다.")

p-value가 0.5보다 작아 귀무가설은 기각됨.
출처 https://www.kaggle.com/datasets/agileteam/bigdatacertificationkr