데이터가 횟수나 측정값을 포함하는지, 표본이 얼마나 큰지, 측정 대상이 무엇인지에 따라 다양한 유형의 유의성 검정 방법이 있다. 가장 자주 사용되는것이 지금 정리하고자 하는 t검정이다.
t검정에 추가적인 설명은 노트 + https://velog.io/@ljs7463/%EB%8F%85%EB%A6%BD%ED%91%9C%EB%B3%B8%EA%B2%80%EC%A0%95-%EB%8C%80%EC%9D%91%ED%91%9C%EB%B3%B8-%EA%B2%80%EC%A0%95
https://velog.io/@ljs7463/%EB%8F%85%EB%A6%BD%ED%91%9C%EB%B3%B8%EA%B2%80%EC%A0%95-%EB%8C%80%EC%9D%91%ED%91%9C%EB%B3%B8-%EA%B2%80%EC%A0%95
from scipy import stats
res = stats.ttest_ind(session_times[session_times.Page == 'Page A'].Time,
session_times[session_times.Page == 'Page B'].Time,
equal_var =False)
print(f'p-value for single sided test : {res.pvalue / 2:.4f}')
>>>
p-value for single sided test : 0.1408
대안가설은 페이지 A에 대한 평균 세션 시간이 페이지 B에 대한 평균보다 작다는 것이다.
0.1408의 p값은 수열검정을 통해 얻은 p값 0.121과 0.126에 매우 가깝다.