분산과 표준편차

rokky·2023년 4월 2일

통계

목록 보기
11/17

분산(variance)

  • 평균과 관측치에 대해 편차 제곱의 평균값을 의미한다.
  • N개의 데이터의 평균이 주어졌을 때 분산은

분산을 사용하는 이유

  • 편차는 평균과의 차이라 다 더하면 0이 된다.
  • 분산이 작을 때 : 데이터가 평균에 가까울 수록
  • 분산이 클때 : 데이터가 평균에서 멀어질 수록

표준편차(standard deviation)

  • 표준편차는 분산의 양의 제곱근이다.
  • 분산이 제곱을 이용해서 커지는 것을 원래 크기로 표준화한 것이다.
  • 표준편차는

파이썬을 이용한 분산, 표준편차 계산

import math

arr = [50, 47, 39, 61, 74]

mean = 0
for i in arr:
  mean = mean + i/len(arr)

variance = 0
for i in arr:
  variance = variance + ((i-mean)**2)/len(arr)

std = math.sqrt(variance)

print(mean)
print(variance)
print(std)
  • 결과
    54.2
    147.76
    12.155657119218196

0개의 댓글