통계에 대한 나의 이해

단디·2024년 10월 4일
1

"이 세상 모든 것을 측정할 수 없다"는 것에서 통계는 시작되었다.
그러므로 이 세상은 불확실하다.
우리는 불확실한 세상속에서 확실한 세상을 꿈꾼다.
불확실한 세상에서 세상의 일부를 이용해서 세상 전체를 예측하기 위해 통계가 시작되었다.

모집단(Population): 내가 관심있는 집단의 전체
표본(Sample): 랜덤하게 잘 섞인 모집단을 대표할 수 있는 일부
ex) 잘 섞어서 간 보기

내가 관심있는 집단에서 표본을 추출해서 표본의 통계량을 구하고 분석하여 모집단을 추정 및 검증을 한다.

우리는 낮은 확률에 관심을 가져야한다.
우리는 이것이 "우연이 아니다"란 것을 밝히고자 가설 검정을 한다.

귀무가설(H_0): Null Hypothesis ex) 아무 효과가 없는 것
대립가설(H_1): 밝히고자 하는 가설

우리가 궁금한 것은 우연하다란 조건에서 우연히 일어날 가능성이 매우 낮으면 그것은 유의하다, 즉 효과가 있다, 귀무가설을 기각하기 위한 것이다.

모집단의 확률 분포가 정규분포를 따른다면 기각역 안에서 발생하는 오류가 제 1종오류, 기각역 밖에 분포하는 것을 잘못 판단하면 그것은 제 2종오류이다.

무죄인 사람은 유죄, 유죄인 사람은 무죄
무엇이 더 치명적인가
무죄추정의 원칙, 제 1종 오류를 더 중요하게 취급

양품을 불량으로, 불량을 양품으로
암이 아닌 사람을 암진단, 암인 사람을 건강 진단
무엇이 더 치명적인가
제 2종 오류를 중요하게 생각해야하는 이유

profile
협업, 문제해결, 지속적 학습을 추구하는 개발자 지망생 단디입니다.

0개의 댓글