boks.log
로그인
boks.log
로그인
5/5 통계 학습
boks
·
2024년 5월 5일
팔로우
0
수학
목록 보기
1/7
📖 학습한 내용
가설검정 시행
가설검정 관련 그래프
제1종 오류와 제2종 오류
📖 핵심내용 정리
개념을 알기위해 예시를 드는데, 신약과 위약을 투입한 두 집단의 데이터를 사용한다. 2개 집단 간의 평균값을 비교하는 검정 통계를 알아본다.
이것을 '이표본 t검정'이라고 한다.
📌가설검정 시행
귀무가설이 옳은 세계를 상정하여 모평균차가 0라고 가정했을때 t분포를 이용한다.
신약집단과 위약집단의 평균의 실제 값을 t분포 상의 위치값으로 바꾼다. 그리고 나온 값까지의 분포 넓이를 구하여 그 값이 나올 수 있는 확률을 구한다. 양측검정을 하기에 2배를 곱하면 p값이된다.
유의 수준α은 쓰이는 곳마다 다르지만, 이 책에서는 0.05로 설정
p<0.05 -> 결론 : '통계적으로 유의미한 차이를 보였다.' 기술
p>0.05 -> 결론 : '통계적으로 유의미한 차이를 발견할 수 없었다.' 기술
유의미한 차이가 없다는 것은 '결론을 보류한다'는 판단이다.
📌가설검정 관련 그래프
오차 막대는 막대그래프나 산점도를 그릴때 평균값 기준으로 그린다.
평균값의 확률, 신뢰구간, 데이터 퍼짐을 표기할 수 있다.
정확한 값은 알기 어렵지만 시각화하여 파악하기 좋다!
📌제1종 오류와 제2종 오류
제1종 오류 : 실제로 아무런 차이가 없지만, 차이가 있다고 판단 ( 귀무가설을 기각한 경우)
제2종 오류 : 실제로 차이가 있지만, 차이가 있다 말할 수 없다고 판단 (귀무 가설을 기각하지 않은 경우)
유의수준 α, 검증력 1-β, 효과크기 d를 미리 설정하고, 표본크기를 구한다.
📖 흥미로운 점 / 새로 알게된 점
가설검정이 곧 신뢰구간 구하는 것과 똑같은 개념이여서 신기했다.
그래프를 볼때 알 수 없는 것들이 있었는데 오차 막대였다는 것을 알 수 있었다.
가설 검증은 결국 오류가 난다고 인정하는 부분이 흥미로웠다. 애초에 유의수준 α가 그런 뜻인 것을 알았다.
거의 모든 식에 표본크기 n이 들어가서, 표본 크기는 얼만큼 해야하는지 궁금했다. 그런데 마지막 부분인 가설검증 단계에서 필요한 요소들을 정하여 표본크기를 정할 수 있다는게 신기했다. 마지막 단계를 먼저하고 그 다음 실험을 시작해야한다는게 인상 깊었다.
2개 집단을 고려한 비편향표준편차
📖 어려운 부분
'어떤게 있다고 말할 수가 없다'는 식의 말장난 같은 표현이 많아서 쉽게 읽히지 않았다.
하지만 곰곰히 생각해보면, 이런 표현보다 정확하고 쉬운 표현이 없었다.
비편향표준편차 같은 부분을 수학적으로 이끌어내는 부분이 빠져있어서, 원리가 무엇인지 파악하기 더욱 힘들었다. 하지만 개념적인 부분과 흐름을 이해하는데 문제는 없었고, 공식 유도도 구글에 검색하여 유튜브를 찾아 들으니 이해할 수 있었다.
찾아본 사이트 링크
https://angeloyeo.github.io/
📖 이후 학습 계획
주말에는 앞으로도 꾸준히 '통계101 데이터분석' 책을 읽으며 데이터분석에 쓰이는 통계를 익힐 생각이다.
수학적인 증명은 책에서 나오지 않으나, 유튜브와 구글링으로 쉽게 찾을 수 있으므로 그것들을 잘 활용할 생각이다.
내일은 대체공휴일 월요일이니, 파이썬 강의를 들으면서 좀 더 파이썬에 익숙해질 생각이다.
boks
설계엔지니어의 변신
팔로우
다음 포스트
5/6 통계 학습
0개의 댓글
댓글 작성