분산(variance)
- 평균과 관측치에 대해 편차 제곱의 평균값을 의미한다.
- N개의 데이터의 평균이 주어졌을 때 분산은

분산을 사용하는 이유
- 편차는 평균과의 차이라 다 더하면 0이 된다.
- 분산이 작을 때 : 데이터가 평균에 가까울 수록
- 분산이 클때 : 데이터가 평균에서 멀어질 수록
표준편차(standard deviation)
- 표준편차는 분산의 양의 제곱근이다.
- 분산이 제곱을 이용해서 커지는 것을 원래 크기로 표준화한 것이다.
- 표준편차는

파이썬을 이용한 분산, 표준편차 계산
import math
arr = [50, 47, 39, 61, 74]
mean = 0
for i in arr:
mean = mean + i/len(arr)
variance = 0
for i in arr:
variance = variance + ((i-mean)**2)/len(arr)
std = math.sqrt(variance)
print(mean)
print(variance)
print(std)
- 결과
54.2
147.76
12.155657119218196