변화의 원인을 결정론적으로 확신하는 것이 결정론적 의사결정
어떤 사건이 우연히 발생활 확률이 얼마일까
라고 시작하는 것이 통계적 의사결정의 시작
자료를 설명하는 대표적인 특징
자료의 대표값(평균, 중간값, 최빈값, 표준편차, 분산, 구간, 최대값, 최소값 .. )
분산의 마법
의미 : 자료의 중심값으로서 자료의 특성을 대표하는 값
특징
1. 수학적 연산이 가능
2. 모든 자료로부터 영향. 이상값에 영향이 크다(아웃라이어에 취약)
의미 : 내가 가진 자료(데이터)가 평균값을 중심으로 퍼져 있는 평균적인 거리
자료의 값들이 평균값으로부터 평균적으로 얼마나 멀어져 있는가
분자 = 제곱합 / 분모 = 자유도
계산이 쉽다!
가우스에 따르면 데이터의 불규칙성이 정규분포를 따르고 있으면 최소제곱법이 가장 좋은 추정 방법이고, 그 결과 평균값이 가장 좋은 추정값이 됨.
체비체프에 따르면, 데이터의 불규칙성이 어떠하든 [평균값 +- 2XSD] 범위 안에는 반드시 전체의 3/4 이상이 존재함.
따라서, 계산이 가장 용이함.