이후 재밌는 케이스가 나온다. 귀무가설이 둘 사이에 차이가 없다. 였는데 p-value 0.05 값 이상의 값이 나와서 상한 값 내의 값이 나왔다.
그런데 시간이 지나면서 표본의 개수가 많아지며 통계적 특성상 신뢰 구간의 상한선 또한 낮아지면서 p-value가 0.05보다 작아지게 된다!!
이를 [ 효과 크기를 무시한 유의성 검정 ] 이라고 한다.
실험 크기를 증가시키면 아주 작은 효과 크기에 대해서도 유의성을 확보할 수 있다.
즉, 없는데 있다고 판단할 오류를 배제할 수 있다.
하지만 아주 작은 효과 밖에 없다면,
과연 그 효과가 ‘없는데 있다고 판단할 오류’를 범하지 않기 위해 애쓸 필요가 있을까?
그 정도 차이는 있어도 소용 없으니 차라리 다른 실험을 준비하는 편이 낫다.
이 문제를 친구와의 키재기 내기로 비유하면 이렇다.
내 옆의 친구와 나의 키가 아주 비슷한데 내 생각에는 내가 확실히 더 큰 것 같다.
이를 증명하고자 1 마이크로 미터까지 계측이 가능한 자를 가져와서 나와 내 친구의 키를 측정한다.
결론적으로 10 마이크로 미터 만큼 내 키가 더 크다.
친구를 이겨서 기분은 좋을지 모르지만 시간 낭비하기에 참 좋은 일이다.
애초에 어떤 비교에서든 차이가 0일 가능성은 거의 없다.
얼마나 의미있는 계측 단위에서 차이가 있는지 없는지 구분하는 것이 중요하다.
https://boxnwhis.kr/2016/04/15/dont_be_overwhelmed_by_pvalue.html
항상
유의미한 차이가 있다.