중심극한정리 (CLT)
여러 샘플들의 평균은 정규분포모습니다.(30회이상)
샘플을 몇 번 뽑는가도 중요하지만 몇개를 하느냐도 중요
SIZE 클 수록 점점 정규분포모양
큰수법칙 -평균,분산
중심극한 - 평균
신뢰도 defalt 값 0.95
if con=1 , 예측이 100프로 맞을 것이다라는 전제 - 사용x
pdf와 cdf의 차이
실제모집단의 평균이 95% 안 -> 다르지 않다.
95% 밖(신뢰구간 밖) -> 가설이 틀렸다.
신뢰구간과 t-test 가설검정도 연관지어 생각해보기
평균의 평균 -> 표본평균의 평균
이유불충분의 원리(The Principle of Insufficient reason)
조건부확률
베이즈정리, 베이지안 추측의 사용 예시
:법원에서 증거를 채택해야하는 상황(약물의반응,음주측정,임신여부)
이에 대해 항상 FPR(false positive rate)와 사전확률을 통해 정확한 확률을 계산해야함
P(B|A)P(B)=P(B|A)P(A)
민감도(sensitivity), 특이도(specificity)
TPR(True Positive Rate)=민감도
ex)암환자를 진찰해서 암이라고 진단함
FPR(False Positive Rate)=1-특이도
ex)0인 케이스에 대해 1로 잘못예측한 비율(암환자가 아닌데 암이라고 진단)
베이지안 계산 -> 4개변수필요