확률과 통계 #4 Random Variable

Kyeongmin·2024년 10월 13일
0

대학원

목록 보기
27/27

이 글은 최성준 교수님의 확률과 통계 강의를 듣고 정리한 내용입니다.


앞서 다뤘던 내용을 먼저 살펴보시면 본 글의 이해에 도움이 됩니다.


확률 변수

이제 우리가 확률에서 본격적으로 많이 들어봤을만한 확률 변수(Random Variable)에 대해서 말하려고 한다.
여기서 말하려는 Random Variable은 이전 글에서 다뤘던 Probability와는 다른 개념이지만 혼동할만한 점이 있어, 2개를 비교해가면서 설명하려고 한다.

1️⃣ 정의

확률 변수도 Probability Measure와 마찬가지로 입력을 Subset으로 하는 Set Function이다.
다만 Probability Measure는 Sample Space 내 Subset의 면적을 통해 확률로 나타내는 함수이지만,
확률 변수(아래 그림의 XX)는 Sample Space 내 Subset을 관측 공간 내의 실수값으로 대응시키는 함수이다.

이러한 확률 변수를 수식으로 나타내면 아래와 같다.

X:ΩR such that BB,  X1(B)AX : \Omega \to \mathbb{R} \text{ such that } \forall B \in \mathscr{B},\;X^{-1}(B) \in \mathscr{A}

확률 변수는 연속형 또는 이산형 값을 모두 가질 수 있으며,
확률 변수의 값에 해당되는 BB의 역상(inverse image)은 표본 공간에 속하며 이에 대해
Probability Measure(→Probability allocation function)의 결과 값((=면적) 이
확률 변수값에 대한 확률이라고 말할 수 있다.

P(XB)P(X1(B))=P({ωΩ:X(ω)B})P(X \in B) \triangleq P(X^{-1}(B)) = P(\{ \omega \in \Omega : X(\omega) \in B \})

용어

아래는 확률 변수에 사용되는 용어들인데, 참고만 하자.

  • Random experiment : 무작위 시행에 대한 결과 (ex. 우리가 실제 주사위를 굴렸을때 나온 값 in Sample Space)
  • Realization : ωΩ\omega \in \Omega에 해당하는 X(ω)X(\omega)
  • Alphabet of XX : XX의 모든 Realization Set

2️⃣ 예시

  • Random Variable을 이용한 확률 계산

    • Ω={1,2,3,4,5,6},  A=2Ω,  X=123456101020103010\Omega = \{1,2,3,4,5,6\}, \; \mathscr{A}=2^{\Omega},\; X=\begin{array}{|c|c|c|c|c|c|} \hline 1 & 2 & 3 & 4 & 5 & 6 \\ \hline 10 & -10 & 20 & -10 & 30 & -10 \\ \hline \end{array}
    • 위와 같이 표본 공간과 확률 변수가 주어졌을때,
      P(X10)=P({1,2,4,6}=23P(X \leq 10) = P(\{1, 2, 4, 6\} = \frac{2}{3}, 확률은 2/3 이다.
  • Indicator function
    Indicator function은 특정 사건 AA에 속하는 원소만들 모으는 함수라고 생각하면 된다. (참고만 해두자.)
    IA(ω)={1,ωA0,elseandP(IA=1)=P(A)I_A(\omega) = \begin{cases} 1, & \omega \in A \\ 0, & \text{else} \end{cases} \quad \text{and} \quad P(I_A = 1) = P(A)

이산형 확률 변수

위에서 확률 변수는 연속형 / 이산형 값 모두 가질 수 있다고 말했는데,
먼저 이산형 확률 변수(Discrete Random Variable)에 대해서 알아보고,
이산형 확률 변수를 가지는 분포들에는 어떤 종류들이 있는지 하나씩 살펴보고자 한다.

1️⃣ 이산형 확률 변수

이산형 확률 분포는 아래 수식과 같이 정의할 수 있는데,
이를 다시 말하자면, 확률 변수 XX에 의해 관측되는 이산형 값인 xix_i가 존재하고, 모든 xix_i에 대한 확률의 합이 1이라는 것을 의미한다.

{xi:i=1,2,} such that P(X=xi)=1\{x_i : i = 1, 2, \dots\} \text{ such that } \sum P(X = x_i) = 1

여기서부터는 Sample Space를 비롯해서 Probability Measure, Probability Allocation Function에 대해서는
언급하지 않을 것이다. 대신 Observation Space에서 정의되는 관측값과 함수로 대체하여 정의하고 설명할 것이다.

2️⃣ PMF 정의 및 조건

그렇다면, 기존에 Probability Measure를 통해 측정하던 확률은 어떻게 할 것인가?

이는 Observation Space의 PMF(Probability Mass Function, 확률 질량 함수)로 정의할 것인데,
이는 기존의 Probability Measure의 역할을 하는 함수라고 생각하면 될 것 같다.

아래의 pX(x)p_{_X}(x) 는 PDF, P(X=x)P(X=x)는 기존의 Probability Measure 이다.

pX(x)P(X=x)p_{_X}(x) \triangleq P(X=x)

PMF의 조건

이때 PMF도 마찬가지로 기존의 Probability Measure의 조건을 충족해야 한다.

  1. 0pX(x)10 \leq p_{_X}(x) \leq 1
  2. xpX(x)=1\sum_x p_{_X}(x) = 1
  3. P(XB)=xBpX(x)P(X \in B) = \sum_{x \in B} p_{_X}(x)

3️⃣ PMF 예시

3개의 동전이 있을 때, 확률 변수 XX를 동전의 앞면 개수로 정의해보자.

그렇다면 PMF는 각각 동전 앞면의 개수에 따라 아래와 같이 정의할 수 있을 것이고,
X1X\geq1인 경우의 확률 또한 구할 수 있을 것이다.

pX(x)={18,x=038,x=138,x=218,x=30,elseP(X1)=38+38+18=78p_X(x) = \begin{cases} \frac{1}{8}, & x = 0 \\ \frac{3}{8}, & x = 1 \\ \frac{3}{8}, & x = 2 \\ \frac{1}{8}, & x = 3 \\ 0, & \text{else} \end{cases} \quad\quad\quad\cdots\quad\quad P(X \geq 1)=\frac{3}{8} + \frac{3}{8} + \frac{1}{8} = \frac{7}{8}

이산형 확률 변수의 분포

이산형 확률 변수의 분포는 아래와 같은 유형이 있다.

1️⃣ 베르누이 분포

베르누이 분포(Bernoulli distribution) 는, 하나의 시행에서 두 가지 결과 중 하나(성공 또는 실패)가 나오는 확률분포이다. 아래 PMF에서 pp는 성공할 확률, 1p1-p는 실패할 확률을 의미한다.

확률 질량 함수(PMF)

P(X=x)={pif x=11pif x=0P(X=x)= \begin{cases} p & \text{if} x=1\\ 1−p & \text{if} x=0\\ \end{cases}

기댓값과 분산

E[X]=pVar(X)=p(1p)\begin{aligned} E[X] &=p \\ \text{Var}(X) &=p(1−p) \end{aligned}

2️⃣ 균등 분포

: 균등 분포(Uniform distribution) 는, 모든 값이 동일한 확률을 가지는 확률 분포이다. 균등 분포는 이산 / 연속 확률 변수 둘 다 존재한다.

확률 질량 함수(PMF)

P(X=x)=1n,x{x1,x2,,xn}P(X=x)= \frac{1}{n}, \quad\quad x\in\{x_1, x_2, \dots, x_n\}

기댓값과 분산

E[X]=i=1nxinVar(X)=i=1n(xiE[X])2n\begin{aligned} E[X] &= \frac{\sum_{i=1}^n x_i}{n} \\ \text{Var}(X) &= \frac{\sum_{i=1}^n (x_i - E[X])^2}{n} \end{aligned}

3️⃣ 기하 분포

: 기하 분포(Geometric distribution) 는, 특정 사건이 처음 발생할 때까지의 시행 횟수를 나타내는 확률분포이며, 각 시행은 독립적이고 성공 확률 pp는 일정하다.

확률 질량 함수(PMF)

P(X=k)=(1p)k1p,k=1,2,3,P(X = k) = (1 - p)^{k-1} p, \quad k = 1, 2, 3, \dots

기댓값과 분산

E[X]=1pVar(X)=1pp2\begin{aligned} E[X] &= \frac{1}{p} \\ \text{Var}(X) &= \frac{1 - p}{p^2} \end{aligned}

4️⃣ 이항 분포

: 이항 분포(Binomial Distribution) 는, 고정된 시행 횟수 nn 동안, 성공 확률 pp 인 사건이 몇 번 발생하는지를 나타내며, 시행은 독립적이고 성공 확률은 일정하다.

확률 질량 함수(PMF)

P(X=x)=(nk)pk(1p)nk,k=0,1,2,,nP(X=x)= \binom{n}{k} p^k (1-p)^{n-k}, \quad k = 0, 1, 2, \dots, n

기댓값과 분산

E[X]=npVar(X)=np(1p)\begin{aligned} E[X] &= n \cdot p \\ \text{Var}(X) &= n \cdot p \cdot (1-p) \end{aligned}

5️⃣ 음이항 분포

: 음이항 분포(Negative Binomial Distribution) 는, kk 번의 성공이 일어나기까지 필요한 rr 번의 실패 횟수를 나타내며, 기하 분포의 일반화된 형태이다.

확률 질량 함수(PMF)

P(X=x)=(k+r1k)(1p)rpkP(X=x)= \binom{k+r-1}{k} (1-p)^{r}p^k

기댓값과 분산

E[X]=rpVar(X)=r(1p)p2\begin{aligned} E[X] &= \frac{r}{p} \\ \text{Var}(X) &= \frac{r(1-p)}{p^2} \end{aligned}

6️⃣ 포아송 분포

: 포아송 분포(Poisson Distribution) 는, 단위 시간 또는 공간에서 특정 사건이 발생하는 횟수를 나타내며, 사건 발생은 독립적이며 고정된 비율 λ\lambda 로 발생한다고 가정한다.

확률 질량 함수(PMF)

P(X=x)=λkeλk!,k=0,1,2,P(X=x)= \frac{\lambda^k e^{-\lambda}}{k!}, \quad k = 0, 1, 2, \dots

기댓값과 분산

E[X]=λVar(X)=λ\begin{aligned} E[X] &= \lambda \\ \text{Var}(X) &= \lambda \end{aligned}

연속형 확률 변수

1️⃣ 연속형 확률 변수

연속형 확률 분포는 아래 수식과 같이 정의할 수 있는데,
이를 다시 말하자면, 확률 변수 XX에 의해 관측되는 연속형 값인 xix_i가 존재하고, 모든 xix_i에 대해 적분한 값의 합이 1이라는 것을 의미한다.

fX(x) such that P(XB)BfX(x)dxf_X(x) \text{ such that } P(X\in B) \int_B f_X(x)dx

2️⃣ PDF 정의 및 조건

이는 Observation Space의 PDF(Probability Density Function, 확률 질량 함수)로 정의할 것인데,
이는 기존의 Probability Measure의 역할을 하는 함수라고 생각하면 될 것 같다.

아래의 fX(x)f_{_X}(x) 는 PDF, P(X=x)P(X=x)는 기존의 Probability Measure 이다.

fX(x)P(X=x)f_{_X}(x) \triangleq P(X=x)

이때 PDF도 마찬가지로 기존의 Probability Measure의 조건을 충족해야 한다.

  1. fX(x)dx=1(1<fX(x) is possible)\int^\infty_{-\infty} f_X(x)dx = 1 \quad\dots\quad (1 < f_X({x}) \text{ is possible})
  2. P(XB)=xBfX(x)dxP(X \in B) = \int_{x\in B} f_X(x) dx

연속형 확률 변수의 분포

연속형 확률 변수의 분포는 아래와 같은 유형이 있다.

1️⃣ 균등 분포

균등 분포(Uniform distribution) 는, 특정 구간 [a,b][a,b] 에서 모든 값이 동일한 확률 밀도를 가지는 연속 확률 분포이다.

확률 밀도 함수(PDF)

f(x)={1ba,if axb0,otherwisef(x) = \begin{cases} \frac{1}{b-a}, & \text{if } a \leq x \leq b \\ 0, & \text{otherwise} \end{cases}

기댓값과 분산

E[X]=a+b2Var(X)=(ba)212\begin{aligned} E[X] &= \frac{a + b}{2} \\ \text{Var}(X) &= \frac{(b-a)^2}{12} \end{aligned}

2️⃣ 지수 분포

지수 분포(Exponential distribution) 는, 사건이 발생하는 시간 간격을 모델링한다. 사건이 포아송 프로세스(Poisson Process)를 따를 때, 연속적 시간 간격은 지수 분포를 따른다.

확률 밀도 함수(PDF)

f(x)={λeλx,x00,otherwisef(x) = \begin{cases} \lambda e^{-\lambda x}, & x \geq 0 \\ 0, & \text{otherwise} \end{cases}

기댓값과 분산

E[X]=1λVar(X)=1λ2\begin{aligned} E[X] &= \frac{1}{\lambda} \\ \text{Var}(X) &= \frac{1}{\lambda^2} \end{aligned}

3️⃣ 라플라스 분포

라플라스 분포(Laplace distribution) 는, 평균 주변에서의 변화가 기하급수적으로 감소하는 대칭적인 분포로 정규 분포와 유사하다. 이는 데이터의 변화가 급격한 경우를 모델링하는 데 적합하다.

확률 밀도 함수(PDF)

f(x)=12bexp(xμb)f(x) = \frac{1}{2b} \text{exp}\Big({-\frac{|x-\mu|}{b}}\Big)

기댓값과 분산

E[X]=μVar(X)=2b2\begin{aligned} E[X] &= \mu \\ \text{Var}(X) &= 2b^2 \end{aligned}

4️⃣ 가우시안 분포

가우시안 분포(Gaussian distribution) 또는 정규 분포라고 말하며 이는, 평균과 분산만으로 정의가 가능한 분포로 가장 많은 확률 변수의 분포로 사용되는 분포이다.

확률 밀도 함수(PDF)

f(x)=12πσ2exp(12(xμσ)2)f(x) = \frac{1}{\sqrt{2\pi \sigma^2}} \text{exp}\Big({-\frac{1}{2}\big(\frac{x-\mu}{\sigma}}\big)^2\Big)

기댓값과 분산

E[X]=μVar(X)=σ2\begin{aligned} E[X] &= \mu \\ \text{Var}(X) &= \sigma^2 \end{aligned}

5️⃣ 코시 분포

코시 분포(Cauchy distribution) 는, 평균과 분산이 정의되지 않는 분포이며, 분포의 꼬리가 두꺼운 형태로 이상치가 많을 때 주로 사용된다.

확률 밀도 함수(PDF)

f(x)=1πγ(1+(xx0γ)2)f(x) = \frac{1}{\pi \gamma \Big( 1 + \left(\frac{x-x_0}{\gamma}\right)^2 \Big)}

Moment

Moment 는 Random Variable의 분포 형태(중심, 퍼짐, 비대칭성 등)와 같이 다양한 특성을 설명하기 위해 사용되며, 일반적으로 nn-th Moment는 E[Xn]E[X^n]와 같이 나타낸다. 주요한 Moment의 종류는 아래와 같다.

Moment 종류수식정의
1st MomentmX=E[X]m_{_X} = E[X]평균: 데이터의 중심 위치를 나타냄
2nd MomentσX2=Var(X)=E[(XmX)2]\sigma_X^2 = \text{Var}(X) = E[(X - m_{_X})^2]분산: 평균 주변 데이터의 퍼짐 정도
3rd MomentE[(XmX)3]σX3\frac{E[(X - m_{_X})^3]}{\sigma_X^3}비대칭성 (Skewness): 꼬리 방향과 정도
4th MomentE[(XmX)4]σX4\frac{E[(X - m_{_X})^4]}{\sigma_X^4}첨도 (Kurtosis): 꼬리 두께와 중심 집중도

Joint Moment

Joint Moment 는, 2개 이상의 Random Variable 간의 관계를 설명하는데 사용되며, 아래와 같은 종류가 있다.

Moment 종류수식정의
correlationE[XY]E[XY]상관관계, 두 변수 간의 선형 관계의 강도와 방향
covarianceE[(XmX)(YmY)]E[(X-m_{_X})(Y-m_{_Y})]공분산 cov(X,Y)\text{cov}(X, Y)으로 나타내며, 선형 관계를 측정
correlation coefficientcov(X,Y)σXσY\frac{\text{cov}(X, Y)}{\sigma_X\sigma_Y}상관계수 ρXY\rho_{_{XY}} 로 나타내며, 상관관계를 정규화한 값

그리고 Random Variable 간의 관계에 따라 아래의 식이 성립한다.

  • uncorrelated 인 경우, E[XY]=E[X]E[Y]E[XY] = E[X]E[Y] 이다.
    여기서 independent \Rightarrow uncorrelated 이지만, 그 반대는 성립하지 않는다.
  • orthogonal 인 경우, E[XY]=0E[XY] = 0 이다.
profile
개발자가 되고 싶은 공장장이🛠

0개의 댓글

관련 채용 정보