가설검정의 주의점-재현 가능성

김요한·2024년 8월 5일

통계학 기초

통계학

목록 보기

25/30

1) 재현 가능성

우연히 결과가 나오는 것이 아닌, 항상 일관된 결과가 나오는지 확인해야함.

재현 가능성이란?

동일한 연구나 실험을 반복했을 때 일관된 결과가 나오는지 여부, 연구의 신뢰성을 높이는 중요한 요소
ex) 신약이 실험실만이 아닌 실제에서도 일관된 결과가 나오기때문에 개발 가능한 것.
최근 p값에 대한 논쟁이 두드러짐
- p값을 사용하지 않는 것이 좋다.
- 유의수준을 0.05에서 변경하는 것이 좋다.
가설검정 원리상 문제나 가설검정의 잘못된 사용이 낮은 재현성으로 이어진다는 문제 발생.
최근 논문을 다시 재현해서 실험을 해보는데 똑같은 결과가 안나오는 사례가 많은 재현성 위기가 문제가 됨

중요성

결과가 재현되지 않는다면 해당 가설의 신뢰도가 떨어짐

2) 재현성 위기의 원인은 무엇인가

실험 조건을 동일하게 조성하기 어려움

완전 동일하게 다시 똑같은 실험을 수행하기 어려움
가설검정 자체도 100% 검정력을 가진것이 아니라 오차가 나타날 수 있음

가설검정 사용방법에 있어서 잘못됨

p값이 0.05가 유도하게끔 조작하는 것이 가능 (p해킹)
실제로는 통계적으로 아무 의미가 없음에도 의미가 있다고 해버리는 1종 오류를 저지를 수 있음
0.05라는 것은 100번 중 5번 즉, 20번 중에 1번은 귀무가설이 옳음에도 불구하고 기각될 수 있음
유의수준으로 통제하는 것이 중요
하지만, 유의수준을 너무 낮추면 베타값이 커져버리는 문제 발생
따라서, 어떤 논문에선 유의수준을 0.005로 설정하면서 데이터 수를 70% 늘려 베타 값도 컨트롤 하는 방향을 제안
잘못된 가설을 세워도 우연히 0.05보다 낮아서 가설이 맞는거서럼 보일 수도 있음. 따라서 가능한 좋은 가설을 세우는 것도 중요

이전 포스트

상호정보 상관계수

다음 포스트

P-해킹

0개의 댓글