[세상에서 가장 쉬운 통계학 입문] 분산과 표준편차

Sooyeon·2023년 11월 22일
0

정리하며 읽기

목록 보기
18/50
post-thumbnail

[세상에서 가장 쉬운 통계학 입문] 을 읽고 -분산과 표준편차


분산과 표준편차

:흩어져 있는 데이터 상태를 추정하는 통계량

1.불규칙한 통계량을 아는것이 중요하다!

※ 평균값은 데이터의 분포 중,하나에 불과하며
데이터가 그 주변에 얼마나 퍼져있는지 알 수 없다.
(분포의 대표로 선택한 수치 )

2.분산의 이해

  • 편차
    -데이터가 평균값으로부터 어느 정도 큰가,작은가를 나타냄
  • 편차는 제곱을 하고 나서 평균을 구한다.
    =>이때 나온 통계량을 분산이라고 한다.
  • 분산
    데이터가 퍼져 있는 상태를 평가할 수 있는 통계량
  • 분산에 루트를 한 수치 => 표준편차

3.표준편차의 의미

평균값이 데이터의 분포를 대표하는 수치라면,
표준편차는 그 대표값을 기점으로 데이터가 어느정도 멀리 위치해 있는지 나타냄

4.도수분포표로 표준편차를 구하는 방법

  • 도수분포표로 표준편차를 구하는 방법
A(계급값)B(상대도수)AXB
10.30.3
20.51.0
30.10.3
40.10.4
평균값=2.0

=> 도수분포표로 계산한 평균값을 계급값에서 빼면 계급값의 편차를 구할 수 있다.
=>계급값의 편차들을 각각 제곱해 상대도수와 곱한 값을 모두 더하면
계급값 편차 제곱의 산술평균을 구할 수 있다.이것이 분산에 해당
=>이것에 루트를 씌우면 표준편차가 된다.

A(계급값)C(계급값-평균값)C2C^2B(상대도수)C2C^2XB
1-110.30.3
2000.50
3110.10.1
4240.10.4
분산=0.8
표준편차0.8\sqrt{0.8}=약 0.89

총 정리

  • 평균값 계산
    (데이터의 총합)/(데이터의 총 개수)
  • 편차 계산
    (데이터 수치) -(평균값)
  • 분산 계산
    (편차) 제곱의 합 / (데이터의 총 개수)
  • 표준편차 계산
    분산\sqrt{분산}=편차의 제곱평균


0개의 댓글