기초통계학 - (2-2) 기술통계-분산도

Kyung Jae, Cheong·2022년 8월 14일

기초통계학(요약)

목록 보기

3/9

Keyword - 분산도, 범위, 사분위편차, 분산, 표준편차, 표준점수, 첨도

R 	= (H+u/2) - (L-u/2)
	= (H-L) + u
H : 최고값
L : 최저값
u : 측정단위

모든 자료의 요소를 각각 고려하여 흩어진 정도를 나타낸 것
많은 통계에서 평균과 더불어 가장 많이 쓰이는 통계값
편차(Deviation)이란 각 점수가 평균에서 떨어진 정도를 뜻함
$d_i = X_i-\bar X$
편차가 음수인 경우를 보완하기 위해 편차를 제곱 한 후 모두 더하여 총 사례수로 나눈값을 분산(Variance)라 함
$s^2_X = \frac{\Sigma(X_i-\bar X)^2}{n}$
모집단에서는 $σ^2_X$ , 표본에서는 $s^2_X$ 로 표기함

분산에 제곱근을 취한 값
모수치는 σ로 표시하며, 표본통계치는 $s_x$ 로 표기함
$σ_X = \sqrt {σ^2_X} = \sqrt{\frac{\Sigma(X_i-\bar X)^2}{n}}$
(참고) 추리통계에서 표본의 분산 및 표준편차를 계산할때는 n 대신 n-1로 나눈 불편파추정치를 사용함
$s_x = \sqrt {s^2_x} = \sqrt{\frac{\Sigma(x_i-\bar x)^2}{n-1}}$
분산과 표준편차는 분포의 흩어진 정도를 가장 정확하게 설명해주는 통계값임!

분포의 봉(꼭대기)의 뾰족한 정도를 나타냄
정규분포의 첨도는 0
- 정규분포보다 뾰족하면 급첨(leptokurtic), 첨도 +값(양수)
- 정규분포보다 평평하면 평성(platykurtic), 첨도 -값(음수)

일 때문에 포스팅은 잠시 쉬어요 ㅠ 바쁘다 바빠 모두들 화이팅! // Machine Learning (AI) Engineer & BackEnd Engineer (Entry)