확률변수(random variables) - 1. 단일 확률 변수

choonsikmom·2023년 12월 15일
0

Mathematics

목록 보기
3/4
post-thumbnail

Single Random Variables and Probability Distributions

Random variable(확률변수)

확률 실험의 실험 결과나 사건을 sample space에서 실수축의 한 점으로 mapping시키는 함수이다.

  • 확률 변수의 종류
    1. Discrete random variable (이산확률변수)
      : “countable”한 값만을 포함하는 확률 변수 (e.g. 주사위 확률, 동전 확률)
    2. Continuous random variable (연속확률변수)
      : 특정 구간 내의 값을 포함하는 확률 변수 (e.g. 0부터 1까지의 랜덤 값)
    3. Mixed random variable (혼합확률변수)
      : 이산 확률과 연속 확률이 혼재되어 있는 확률 변수

Probability Distribution Functions

1. Cumulative Distribution Function (누적분포함수)

연속확률변수 XX에 대한 cdf는 다음과 같의 정의된다.

FX(x)=P(Xx)F_X(x) = P(X≤x)

  • CDF의 성질
    1. 모든 cdf는 x가 감소할수록 0에 가까워지고, 증가할수록 1에 가까워진다.

      limxFX(x)=0\lim_{x \to -\infty}F_X(x)=0 , limxFX(x)=0\lim_{x \to \infty}F_X(x)=0

      FX()=0F_X(-\infin)=0 , FX()=1F_X(\infin)=1

    2. 모든 cdf는 단조 비감소 함수(monotone non-decreasing)이다.

      즉, x2x1x_2≥x_1 이면, FX(x2)FX(x1)F_X(x_2) ≥ F_X(x_1)

    3. 모든 cdf는 우측으로부터의 연속성을 가진다.

      FX(x0)=limxx0+FX(x)F_X(x_0)=\lim_{x \to x_0^+}F_X(x)

    4. XX값이 x1x_1x2x_2사이에 있을 확률은 다음과 같이 표현된다.

      P(x1Xx2)=FX(x2)FX(x1)P(x_1≤X≤x_2)=F_X(x_2)-F_X(x_1)

2. Probability Density Function (확률밀도함수)

연속확률변수 XX에 대한 pdf는 다음과 같이 표현된다.

fX(x)=f_X(x)=dFX(x)dxdF_X(x)\over{dx}

도함수의 정의를 이용하면, pdf를 다음과 같이 표현할 수 있다.

fX(x)=limΔx0f_X(x)=\lim_{\Delta{x}\to 0} FX(x+Δx)FX(x)Δx{F_X(x+\Delta{x})-F_X(x)} \over {\Delta x}

Δx\Delta{x}가 충분히 작으면, limlim을 제거하고 다음과 같이 표현할 수 있다.

FX(x+Δx)FX(x)=P(x<Xx+Δx)=~fX(xΔx)F_X(x+\Delta x) - F_X(x) = P(x<X≤x+\Delta x) \widetilde{=} f_X(x\Delta x)

  • pdf의 성질 확률변수 X에 대한 pdf fX(x)f_X(x)는 cdf FX(x)F_X(x)도함수이다. 또한, cdf FX(x)F_X(x)는 pdf fX(x)f_X(x)적분으로 표현될 수 있다. (미분-적분의 관계) 즉, FX(X)=xfX(u)duF_X(X)=\int^{x}_{-\infin}f_X(u)du
  1. pdf는 non-negative function이다. (→ cdf가 non-decreasing 함수이기 때문에, cdf의 도함수인 pdf 또한 non-negative이다.) 즉, fX(x)0f_X(x)≥0
  2. pdf를 전 구간에 걸쳐 적분하였을 때 그 값이 1이다. (→FX()=1F_X(\infin)=1) fX(x)dx=1\int^{\infin}_{-\infin}f_X(x)dx=1
  3. x1x_1x2x_2 사이에 XX값이 포함될 확률은 다음과 같이 표현된다. P(x1<Xx2)=x1x2fX(x)dxP(x_1<X≤x_2)=\int^{x_2}_{x_1}f_X(x)dx =FX(x2)FX(x1)=x2fx(u)dux1fx(u)du=x1x2fX(u)du= F_X(x_2) - F_X(x_1) = \int^{x_2}_{-\infin}f_x(u)du - \int^{x_1}_{-\infin}f_x(u)du = \int^{x_2}_{x_1}f_X(u)du

cdf, pdf of Discrete Random variable

이산확률변수의 cdf는 weighted and shifted unit step function u(x)u(x)의 합으로 표현될 수 있다.

FX(x)=i=1Npiu(xxi)F_X(x)=\sum^{N}_{i=1}p_iu(x-x_i)

마찬가지로, 이산확률변수의 pdf fX(x)f_X(x)weighted and shifted unit impulse function δ(x)\delta (x)의 합으로 표현될 수 있다.

fX(x)=i=1Npiδ(xxi)f_X(x)=\sum^N_{i=1}p_i\delta(x-x_i)


Continuous random variable and their Distribution Functions

(연속확률변수와 그 분포함수)

1. Uniform Random Variable

균등분포의 pdf는 다음과 같다.

fX(x)={1(ba)a≤x≤b, b>a0otherwisef_X(x)=\left\{ \begin{array}{ll} {1\over (b-a)} & \text{a≤x≤b, b>a} \\ 0 & \text{otherwise} \end{array} \right.

균등분포의 cdf는 다음과 같다.

FX(x)={0axb,b>axabaa<x≤b1x>bF_X(x)=\left\{ \begin{array}{ll} {0} & \text{} a\leq x\leq b, b>a \\ \frac{x-a}{b-a} & \text{a<x≤b} \\ 1 & \text{x>b} \end{array} \right.

2. Gaussian Random Variable

가우시안 분포의 pdf는 다음과 같다.

fX(x)=e(xm)2/2σ22πσ2f_X(x)=\frac{e^{(x-m)^2/2\sigma^2}}{\sqrt{2\pi\sigma^2}}

가우시안 분포의 cdf는 적분으로 직접 구하기 어려워, Q 함수(또는 error 함수)를 사용하여 표현한다.

FX(x)=1Q(xmσ)F_X(x) = 1-Q(\frac{x-m}{\sigma})

Q함수의 정의

Q(x)=12πxeu2/2duQ(x)=\frac{1}{2\pi}\int^\infin_xe^{-u^2/2}du

error 함수(오차함수)의 정의

erf(x)=2π0xeu2duerf(x)=\frac{2}{\sqrt{\pi}}\int^x_0e^{-u^2}du

3. Exponential Random Variable

지수 분포의 pdf

fX(x)=αeαxu(x),f_X(x)=\alpha e^{-\alpha x} u(x), α>0\alpha > 0

지수 분포의 cdf

FX(x)=(1eαx)u(x)F_X(x)=(1-e^{-\alpha x})u(x)

4. Gamma Random Variable

감마 분포의 pdf는 다음과 같다.

fX(x)=cbΓ(b)xb1ecxu(x),f_X(x)=\frac{c^b}{\Gamma(b)}x^{b-1}e^{-cx}u(x), b,c>0b, c > 0

Γ(b)=0yb1eydy\Gamma(b)=\int^{\infin}_{0}y^{b-1}e^{-y}dy

  • Chi-square pdf
    fX(x)=12n/2Γ(n/2)x(n/2)1ex/2u(x)f_X(x)=\frac{1}{2^{n/2}\Gamma(n/2)}x^{(n/2)-1}e^{-x/2}u(x)
  • Erlang pdf
    fX(x)=cn(n1)!xn1ecxu(x)f_X(x)=\frac{c^n}{(n-1)!}x^{n-1}e^{-cx}u(x)

5. Cauchy Random Variable

fX(x)=α/πx2+α2f_X(x)=\frac{\alpha/\pi}{x^2+\alpha^2}

FX(x)=12+1πtan1xαF_X(x)=\frac{1}{2}+\frac{1}{\pi}\tan^{-1}\frac{x}{\alpha}


Discrete random variable and their Distribution Functions

(이산확률변수와 그 분포함수)

1. Binomial Random Variable

이항 분포

P(X=k)=(nk)pkqnkP(X=k)=\binom{n}{k}p^kq^{n-k},, k=0,1,2,,nk=0,1,2,…,n

where  p+q=1where \ \ p+q=1

fX(x)=kxn(nk)pkqnkδ(xk)f_X(x)=\sum^n_{k≤x}\binom{n}{k}p^kq^{n-k}\delta(x-k)

FX(x)=kx(nk)pkqnkF_X(x)=\sum_{k≤x}\binom{n}{k}p^kq^{n-k}

2. Geometric Random Variable

기하 분포는 k번째 시도에서 첫 번째로 성공할 확률에 대한 분포이다.

P(first success at trial k)=P(X=k)=(1p)k1p,P(first \ success \ at \ trial \ k)=P(X=k)=(1-p)^{k-1}p, k=1,2,k=1, 2, …

3. Poisson Random Variable

포아송 분포

P(X=k)=akk!ea,P(X=k)=\frac{a^k}{k!}e^{-a}, k=0,1,2,k=0, 1, 2, …

fX(x)=k=0akk!eaδ(xk)f_X(x)=\sum^{\infin}_{k=0}\frac{a^k}{k!}e^{-a}\delta(x-k)

FX(x)=k=0akk!eau(xk)F_X(x)=\sum^{\infin}_{k=0}\frac{a^k}{k!}e^{-a}u(x-k)

  • **Poisson Point** 임의의 구간 TT에서 kk개의 사건이 발생할 확률 P(X=k)=(λT)kk!eλT,P(X=k)=\frac{(\lambda T)^k}{k!}e^{-\lambda T}, k=0,1,2,k = 0, 1, 2, … 이 때, λ\lambda 는 단위 시간당 발생하는 사건의 수 fW(w)=λeλwu(w)f_W(w) = \lambda e^{-\lambda w}u(w) FW(w)=P(Ww)=1P(X=0)=1eλw,F_W(w)=P(W≤w)=1-P(X=0)=1-e^{-\lambda w}, w0w ≥0

De Moivre-Laplace Theorem(드므와브르-라플라스 정리)

nn 크기가 충분히 크다면, 이항분포를 가우시안 분포로 근사할 수 있다.

pkqnke(km)22πσ2p^kq^{n-k}≈\frac{e^{-(k-m)^2}}{\sqrt{2\pi\sigma^2}},, n>>1n >> 1

드므와브르-라플라스 정리에 근거하여 이항분포의 cdf 또한 다음과 같이 근사된다.

FX(x)1Q(xnpnpq)F_X(x) ≈ 1 - Q(\frac{x-np}{\sqrt{npq}})

4. Pascal Random Variable

일련의 베르누이 시행에서 k번 성공하기까지 실행 횟수에 대한 분포

P=(X=k)=(n1k1)pkqnk,P=(X=k)=\binom{n-1}{k-1}p^kq^{n-k}, k=1,2,,k=1, 2, …, q=1pq = 1 - p

5. Hypergeometric Random Variable

N개의 모집단에서 n개의 샘플을 무작위로 뽑았을 때 성공 횟수에 대한 분포 (K→ 모집단 성공 횟수, k→샘플 중 성공 횟수)

P(X=k)=(Kk)(NKnk)(Nn),P(X=k)=\frac{\binom{K}{k}\binom{N-K}{n-k}}{\binom{N}{n}}, k=0,1,2,,nk= 0, 1, 2, …, n

profile
춘식이랑 함께하는 개발일지.. 그런데 이제 먼작귀를 곁들인

0개의 댓글