가설검정의 주의점-재현 가능성

김요한·2024년 8월 5일

통계학

목록 보기
25/30
post-thumbnail

1) 재현 가능성

  • 우연히 결과가 나오는 것이 아닌, 항상 일관된 결과가 나오는지 확인해야함.

재현 가능성이란?

  • 동일한 연구나 실험을 반복했을 때 일관된 결과가 나오는지 여부, 연구의 신뢰성을 높이는 중요한 요소
    ex) 신약이 실험실만이 아닌 실제에서도 일관된 결과가 나오기때문에 개발 가능한 것.
  • 최근 p값에 대한 논쟁이 두드러짐
    • p값을 사용하지 않는 것이 좋다.
    • 유의수준을 0.05에서 변경하는 것이 좋다.
  • 가설검정 원리상 문제나 가설검정의 잘못된 사용이 낮은 재현성으로 이어진다는 문제 발생.
  • 최근 논문을 다시 재현해서 실험을 해보는데 똑같은 결과가 안나오는 사례가 많은 재현성 위기가 문제가 됨

중요성

  • 결과가 재현되지 않는다면 해당 가설의 신뢰도가 떨어짐

2) 재현성 위기의 원인은 무엇인가

실험 조건을 동일하게 조성하기 어려움

  • 완전 동일하게 다시 똑같은 실험을 수행하기 어려움
  • 가설검정 자체도 100% 검정력을 가진것이 아니라 오차가 나타날 수 있음

가설검정 사용방법에 있어서 잘못됨

  • p값이 0.05가 유도하게끔 조작하는 것이 가능 (p해킹)
  • 실제로는 통계적으로 아무 의미가 없음에도 의미가 있다고 해버리는 1종 오류를 저지를 수 있음
  • 0.05라는 것은 100번 중 5번 즉, 20번 중에 1번은 귀무가설이 옳음에도 불구하고 기각될 수 있음
  • 유의수준으로 통제하는 것이 중요
  • 하지만, 유의수준을 너무 낮추면 베타값이 커져버리는 문제 발생
  • 따라서, 어떤 논문에선 유의수준을 0.005로 설정하면서 데이터 수를 70% 늘려 베타 값도 컨트롤 하는 방향을 제안
  • 잘못된 가설을 세워도 우연히 0.05보다 낮아서 가설이 맞는거서럼 보일 수도 있음. 따라서 가능한 좋은 가설을 세우는 것도 중요

0개의 댓글