[세상에서 가장 쉬운 통계학 입문] 을 읽고 -분산과 표준편차
분산과 표준편차
:흩어져 있는 데이터 상태를 추정하는 통계량
1.불규칙한 통계량을 아는것이 중요하다!
※ 평균값은 데이터의 분포 중,하나에 불과하며
데이터가 그 주변에 얼마나 퍼져있는지 알 수 없다.
(분포의 대표로 선택한 수치 )2.분산의 이해
- 편차
-데이터가 평균값으로부터 어느 정도 큰가,작은가를 나타냄
- 편차는 제곱을 하고 나서 평균을 구한다.
=>이때 나온 통계량을분산
이라고 한다.
- 분산
데이터가 퍼져 있는 상태를 평가할 수 있는 통계량
- 분산에 루트를 한 수치 =>
표준편차
3.표준편차의 의미
※
평균값
이 데이터의 분포를 대표하는 수치라면,
표준편차
는 그 대표값을 기점으로 데이터가 어느정도 멀리 위치해 있는지 나타냄4.도수분포표로 표준편차를 구하는 방법
- 도수분포표로 표준편차를 구하는 방법
A(계급값) B(상대도수) AXB 1 0.3 0.3 2 0.5 1.0 3 0.1 0.3 4 0.1 0.4 평균값=2.0 => 도수분포표로 계산한 평균값을 계급값에서 빼면
계급값의 편차
를 구할 수 있다.
=>계급값의 편차
들을 각각 제곱해 상대도수와 곱한 값을 모두 더하면
계급값 편차 제곱의 산술평균
을 구할 수 있다.이것이분산
에 해당
=>이것에 루트를 씌우면표준편차
가 된다.
A(계급값) C(계급값-평균값) B(상대도수) XB 1 -1 1 0.3 0.3 2 0 0 0.5 0 3 1 1 0.1 0.1 4 2 4 0.1 0.4 분산=0.8 표준편차=약 0.89
총 정리
- 평균값 계산
(데이터의 총합)/(데이터의 총 개수)
- 편차 계산
(데이터 수치) -(평균값)
- 분산 계산
(편차) 제곱의 합 / (데이터의 총 개수)
- 표준편차 계산
=편차의 제곱평균