이산확률변수 분산 및 표준편차

PhilAI·2023년 2월 3일

이산확률변수 확률론

ML/DL을 위한 필수 확률과 통계 개념 익히기 📈

목록 보기

7/7

이산확률변수 분산 및 표준편차 정리

이산확률변수 분산

평균으로 부터 떨어진 정도를 의미함

한 선생님은 5명의 학생을 수를 가지는 1반 2반의 시험지를 채점하고 있습니다.
1반과 2반은 동일하게 50점의 반 평균을 가지고 있습니다.
각각 1반과 2반의 학생들의 점수는 아래와 같습니다:
1반 = {50, 50, 50, 50, 50}
2반 = {10, 90, 20, 80, 50}
두 반은 평균은 같습니다만, 1반은 동일한 점수대를 가진 학생이 모여있고 2반은 다양한 점수대를 가진 학생이 모여있습니다.
이처럼 어떤 자료의 값이 평균에서 얼마나 떨어져 있는지를 알려주는 것이 "분산"입니다
평균만 가지고 두반에 동일한 수준의 교육을 제공한다면, 2반은 많이 힘들것으로 예상됩니다.
따라서 두 반의 평균을 넘어서 "분산"을 확인해야 합니다
이산확률변수 분산 공식
$V(X) = \sigma^2 = Var(X) = E((X-\mu)^2)$ = $E(X^2) -|E(x)|^2$

이산확률변수 표준편차

표준 편차는 분산과 동일하게 결과값이 평균과 얼마나 다른지를 보여주나, 분산과 달리 확률 변수와 동일한 단위로 보여주는 것이 특징임

10명의 학생이 수학 시험을 응시했으며 점수는 아래와 같습니다
A = {50, 70, 90, 80, 50, 50, 70, 80, 70, 70}
해당 경우 평균과 분산은 이와 같습니다.
평균 = 68 (점)
분산 = 176 (점의 제곱: 분산의 단위는 평균-특정값의 제곱이기 때문에 )
분산이 점이 아닌 점의 제곱이라는 단위를 가지기 때문에, 얼마나 흩어져 있는지 가늠하기가 어려울 것입니다.
그래서 분산을 평균과 같은 단위로 만들기 위해서 나온 개념이 "표준 편차"입니다.
제곱을 제거하기 위해 분산에 다시 루트를 씌우게 됩니다.
따라서 A반의 표준 편차는 13.266....점입니다
이산확률변수 표준편차 공식
$\sigma = \sqrt Var(X)$

활용 문제

문제 1.

0에서 9 중에서 중복 가능하게 세 숫자를 고르는 간단한 "3개 뽑기" 복권을 하려는 참가자들이 있습니다. 복권 하나에 $1 이고, 다른 참가자들이 고른 세 수가 모두 동일할 때 한 참가자가 $500를 얻습니다. 제이미는 가능성을 높이기 위해 복권 10장을 구입하기로 결정합니다.
아래 표는 X에 대한 확률분포를 나타냅니다. X는 제이미가 이 전략으로부터 얻는 이득입니다.

$\mu x = -5$ 를 이용하여, $\sigma x$ 를 계산하세요.

승리 패배
X = 이득 $490 -$10
P(X) 1% 99%

	승리	패배
X = 이득	$490	-$10
P(X)	1%	99%

문제 풀이

X= 이산확률변수
$\sigma x$ = 표준편차

표준편차 구하는 방법
1. 각 결과값과 평균의 차이를 제곱한다
2. 제곱한 값들을 해당하는 확률과 곱한다
3. 분산을 구하기 위해 이들을 더한다
4. 표준편차를 구하기 위해 분산에 제곱근을 취한다.

$Var(X) = \sigma ^2x = \sum (x_i-\mu_x)^2 \times p_i$

$= (490 - (-5))^2(0.01) + (-10 - (-5))^2(0.99)$
$= 2450.25+ 24.75 \approx 2475$
$\sigma x = \sqrt Var(X) = \sqrt 2475 \approx 49.749$

따라서 표준편차는 49.75달러입니다.

PhilAI

이전 포스트