5/5 통계 학습

boks·2024년 5월 5일

수학

목록 보기
1/7
post-thumbnail

📖 학습한 내용

  • 가설검정 시행
  • 가설검정 관련 그래프
  • 제1종 오류와 제2종 오류

📖 핵심내용 정리

  • 개념을 알기위해 예시를 드는데, 신약과 위약을 투입한 두 집단의 데이터를 사용한다. 2개 집단 간의 평균값을 비교하는 검정 통계를 알아본다.
  • 이것을 '이표본 t검정'이라고 한다.

📌가설검정 시행

  • 귀무가설이 옳은 세계를 상정하여 모평균차가 0라고 가정했을때 t분포를 이용한다.
  • 신약집단과 위약집단의 평균의 실제 값을 t분포 상의 위치값으로 바꾼다. 그리고 나온 값까지의 분포 넓이를 구하여 그 값이 나올 수 있는 확률을 구한다. 양측검정을 하기에 2배를 곱하면 p값이된다.
  • 유의 수준α은 쓰이는 곳마다 다르지만, 이 책에서는 0.05로 설정
  • p<0.05 -> 결론 : '통계적으로 유의미한 차이를 보였다.' 기술
  • p>0.05 -> 결론 : '통계적으로 유의미한 차이를 발견할 수 없었다.' 기술
  • 유의미한 차이가 없다는 것은 '결론을 보류한다'는 판단이다.

📌가설검정 관련 그래프

  • 오차 막대는 막대그래프나 산점도를 그릴때 평균값 기준으로 그린다.
  • 평균값의 확률, 신뢰구간, 데이터 퍼짐을 표기할 수 있다.
  • 정확한 값은 알기 어렵지만 시각화하여 파악하기 좋다!

📌제1종 오류와 제2종 오류

  • 제1종 오류 : 실제로 아무런 차이가 없지만, 차이가 있다고 판단 ( 귀무가설을 기각한 경우)
  • 제2종 오류 : 실제로 차이가 있지만, 차이가 있다 말할 수 없다고 판단 (귀무 가설을 기각하지 않은 경우)
  • 유의수준 α, 검증력 1-β, 효과크기 d를 미리 설정하고, 표본크기를 구한다.

📖 흥미로운 점 / 새로 알게된 점

  • 가설검정이 곧 신뢰구간 구하는 것과 똑같은 개념이여서 신기했다.
  • 그래프를 볼때 알 수 없는 것들이 있었는데 오차 막대였다는 것을 알 수 있었다.
  • 가설 검증은 결국 오류가 난다고 인정하는 부분이 흥미로웠다. 애초에 유의수준 α가 그런 뜻인 것을 알았다.
  • 거의 모든 식에 표본크기 n이 들어가서, 표본 크기는 얼만큼 해야하는지 궁금했다. 그런데 마지막 부분인 가설검증 단계에서 필요한 요소들을 정하여 표본크기를 정할 수 있다는게 신기했다. 마지막 단계를 먼저하고 그 다음 실험을 시작해야한다는게 인상 깊었다.
  • 2개 집단을 고려한 비편향표준편차

📖 어려운 부분

  • '어떤게 있다고 말할 수가 없다'는 식의 말장난 같은 표현이 많아서 쉽게 읽히지 않았다.
    하지만 곰곰히 생각해보면, 이런 표현보다 정확하고 쉬운 표현이 없었다.
  • 비편향표준편차 같은 부분을 수학적으로 이끌어내는 부분이 빠져있어서, 원리가 무엇인지 파악하기 더욱 힘들었다. 하지만 개념적인 부분과 흐름을 이해하는데 문제는 없었고, 공식 유도도 구글에 검색하여 유튜브를 찾아 들으니 이해할 수 있었다.
    찾아본 사이트 링크

    https://angeloyeo.github.io/

📖 이후 학습 계획

  • 주말에는 앞으로도 꾸준히 '통계101 데이터분석' 책을 읽으며 데이터분석에 쓰이는 통계를 익힐 생각이다.
  • 수학적인 증명은 책에서 나오지 않으나, 유튜브와 구글링으로 쉽게 찾을 수 있으므로 그것들을 잘 활용할 생각이다.
  • 내일은 대체공휴일 월요일이니, 파이썬 강의를 들으면서 좀 더 파이썬에 익숙해질 생각이다.
profile
설계엔지니어의 변신

0개의 댓글