Stochastic Processes

Jeong-yun Lee·2025년 12월 7일

I. 확률 및 기본 분포 (Probability and Basic Distributions)

1. 확률 변수 (Random Variables) 및 분포 함수

개념정의 및 특성공식
이산 확률 변수동전 던지기, 주사위 던지기와 같이 셀 수 있는 값을 가지며, pmf (Probability Mass Function, 확률 질량 함수)로 정의됨.pmf: P(X=x)=p(x)P(X = x) = p(x). p(x)=1\sum p(x) = 1p(x)0p(x) \ge 0.
연속 확률 변수균일 분포, 정규 분포와 같이 연속적인 값을 가지며, pdf (Probability Density Function, 확률 밀도 함수)로 정의됨.pdf: P(aXb)=abf(x)dxP(a \le X \le b) = \int_a^b f(x)dx. f(x)dx=1\int f(x)dx = 1f(x)0f(x) \ge 0.
누적 분포 함수 (cdf)확률 변수 XXxx보다 작거나 같을 확률 함수.이산: F(x)=yxp(y)F(x) = \sum_{y \le x} p(y). 연속: F(x)=xf(y)dyF(x) = \int_{-\infty}^x f(y)dy.
기댓값 (Expectation)확률 변수 XX의 평균값.이산: EX=xp(x)\mathbf{E}X = \sum x p(x),. 연속: EX=xf(x)dx\mathbf{E}X = \int_{-\infty}^\infty x f(x)dx,.
분산 (Variance)XX가 기댓값에서 얼마나 퍼져있는지를 나타내는 척도.Var(X)=EX2(EX)2=E(XEX)2\mathbf{V}ar(X) = \mathbf{E}X^2 - (\mathbf{E}X)^2 = \mathbf{E}(X - \mathbf{E}X)^2.

2. 주요 분포 및 속성

분포기호확률 밀도 함수 (pdf/pmf)주요 속성 및 공식
균일 분포 (Uniform)XU(a,b)X \sim U(a, b)f(x)=1baf(x) = \frac{1}{b-a} (단, axba \le x \le b일 때, 아니면 0).cdf F(x)=xabaF(x) = \frac{x-a}{b-a} (단, axba \le x \le b일 때).
지수 분포 (Exponential)Xexp(λ)X \sim exp(\lambda)f(x)=λeλxf(x) = \lambda e^{-\lambda x} (단, x0x \ge 0일 때, 아니면 0).기댓값: EX=1/λ\mathbf{E}X = 1/\lambda. 분산: Var(X)=1/λ2\mathbf{V}ar(X) = 1/\lambda^2,. 무기억 속성: $P(X > s+t
포아송 분포 (Poisson)XPoi(λ)X \sim Poi(\lambda)P(X=k)=λkeλk!P(X = k) = \frac{\lambda^k e^{-\lambda}}{k!} (단, k=0,1,2,...k = 0, 1, 2, ...).EX=Var(X)=λ\mathbf{E}X = \mathbf{V}ar(X) = \lambda,.

3. 확률 및 조건부 확률

  • 확률의 기본 성질: 어떤 사건 EE에 대해 0P(E)10 \le P(E) \le 1이며, 전 공간 SS에 대해 P(S)=1P(S)=1이다.
  • 합의 법칙: E1E2=E_1 \cap E_2 = \emptyset (배반 사건)이면 P(E1E2)=P(E1)+P(E2)P(E_1 \cup E_2) = P(E_1) + P(E_2) 이다,. 일반적인 경우 P(E1E2)=P(E1)+P(E2)P(E1E2)P(E_1 \cup E_2) = P(E_1) + P(E_2) - P(E_1 \cap E_2)이다.
  • 조건부 확률 (Conditional Probability): 사건 FF가 발생했을 때 사건 EE가 발생할 확률.
    P(EF)=P(EF)P(F)P(E|F) = \frac{P(E \cap F)}{P(F)}
  • 베이즈 법칙 (Bayes' Rule): {F1,...,Fn}\{F_1, ..., F_n\}이 수학적 분할(Partition)일 때 (상호 배타적이며 전체 확률이 1일 때):
    P(E)=i=1nP(EFi)=i=1nP(EFi)P(Fi)P(E) = \sum_{i=1}^n P(E \cap F_i) = \sum_{i=1}^n P(E|F_i)P(F_i)

II. 뉴스벤더 모델 (Newsvendor Model)

1. 핵심 개념 및 비용

개념정의수학적 표현 (준비량 XX, 수요 DD)단위 비용 (Unit Cost)
판매량 (Sales)수요와 재고 중 작은 값.min(X,D)min(X, D),.-
초과 재고 (Overstock)재고가 수요를 초과했을 때.(XD)+(X-D)^+,.co=(재료 비용)(잔존 가치)c_o = (\text{재료 비용}) - (\text{잔존 가치}) (또는 폐기 비용 고려),.
재고 부족 (Understock)수요가 재고를 초과했을 때.(DX)+(D-X)^+,.cu=(소매가)(재료 비용)c_u = (\text{소매가}) - (\text{재료 비용}) (기회 비용),.
  • 뉴스벤더 모델의 목표: 초과 재고 비용 coc_o와 재고 부족 비용 cuc_u의 균형을 맞추는 것.
  • 최적 주문량 공식: 총 기대 경제적 비용을 최소화하는 xx^*를 찾는다.
    x=argminX{coE[(XD)+]+cuE[(DX)+]}x^* = \text{argmin}_X \{ c_o \mathbf{E}[(X - D)^+] + c_u \mathbf{E}[(D - X)^+] \}
  • 최적 주문량 계산 (Critical Fraction):
    • 연속 분포: F(y)=cuco+cuF(y) = \frac{c_u}{c_o + c_u}를 만족하는 yy.
    • 이산 분포: F(y)cuco+cuF(y) \ge \frac{c_u}{c_o + c_u}를 만족하는 가장 작은 yy,.

2. (S, s) 정책 (고정 주문 비용 포함)

  • SS (Order-up-to level): 기본 뉴스벤더 모델에서 도출된 최적 주문 수준 yy와 같다,.
  • ss (Reorder point, 임계 임계값): 현재 재고 수준 xxss보다 낮을 경우에만 SS까지 주문을 시작하게 되는 임계값,.
    • ss를 찾으려면, 재고 수준 x=sx=s일 때, "S까지 주문하는 총 예상 비용"과 "아무것도 주문하지 않는 총 예상 비용"이 같아지는 지점을 해(solve)해야 한다,.

III. 대기 행렬 이론 (Queuing Theory)

1. 기본 요소 및 안정성

  • 켄달 표기법 (Kendall's Notation): (도착 시간 분포 / 서비스 시간 분포 / 서버 수 / 대기열 크기).
    • M: 지수 분포 (Markovian/Exponential), D: 결정적/상수 (Deterministic), G: 일반 분포 (General Distribution).
  • 교통 강도 (Traffic Intensity): ρ=DemandCapacity\rho = \frac{\text{Demand}}{\text{Capacity}}.
    • M/M/1/M/M/1/\infty의 경우: ρ=λμ=1/E(U)1/E(V)\rho = \frac{\lambda}{\mu} = \frac{1/\mathbf{E}(U)}{1/\mathbf{E}(V)} (λ\lambda: 도착률, μ\mu: 서비스율, UU: 도착 간격 시간, VV: 서비스 시간).
  • 안정성 (Stability): 무한 대기 공간에서 ρ<1\mathbf{\rho < 1}일 경우 시스템은 안정적이며, ρ1\rho \ge 1이면 불안정하다 (무한대로 발산),.
  • 서버 활용도 (Utilization): 서버가 바쁜 시간의 비율 u=min(1,ρ)u = min(1, \rho) (단일 서버),.
  • 처리율 (Throughput, TH): 시스템의 유출률. 안정적인 시스템에서 TH=λ\text{TH} = \lambda이다.
    • 단일 서버: TH=min(λ,μ)\text{TH} = min(\lambda, \mu).
    • 직렬 시스템: TH=min(λ,μ1,μ2,...,μn)\text{TH} = min(\lambda, \mu_1, \mu_2, ..., \mu_n) (가장 느린 서버가 병목).

2. 주요 공식

  • 리틀의 법칙 (Little's Law): 시스템 내 고객 수 (LL)는 도착률 (λ\lambda)과 시스템 내 체류 시간 (WW)의 곱과 같다.
    L=λW\mathbf{L = \lambda W}
    • 대기열에서: Lq=λWqL_q = \lambda W_q.
    • 시스템에서: Lsys=λWsysL_{sys} = \lambda W_{sys}.
  • 킹맨의 고부하 근사 공식 (Kingman’s approximation, ρ<1\rho < 1): 장기 평균 대기 시간 WqW_q,.
    EWqEV(ρ1ρ)(ca2+cs22)\mathbf{E}W_q \approx \mathbf{E}V \left( \frac{\rho}{1-\rho} \right) \left( \frac{c_a^2 + c_s^2}{2} \right)
    • ca2c_a^2: 도착 간격 시간의 변동 계수 제곱. cs2c_s^2: 서비스 시간의 변동 계수 제곱.
  • M/M/1/\infty 큐잉 모델 (안정적일 때, ρ<1\rho < 1):
    • 시스템 내 평균 고객 수: Lsys=ρ1ρL_{sys} = \frac{\rho}{1-\rho}.
    • 시스템 내 평균 체류 시간: Wsys=1μ(1ρ)W_{sys} = \frac{1}{\mu(1-\rho)}.
    • 대기열 내 평균 고객 수: Lq=LsysρL_q = L_{sys} - \rho (출처에 명시된 형태는 아니지만 유도됨).
    • 대기열 내 평균 체류 시간: Wq=ρμ(1ρ)W_q = \frac{\rho}{\mu(1-\rho)}.

IV. 마르코프 연쇄 (Markov Chain)

1. 이산 시간 마르코프 연쇄 (DTMC)

  • 마르코프 속성 (Markov Property): 미래 상태 Xn+1X_{n+1}는 현재 상태 XnX_n에만 의존하며, 과거 이력에는 독립적이다.
    P(Xn+1=jX0=i0,...,Xn=i)=P(Xn+1=jXn=i)P(X_{n+1} = j | X_0=i_0, ..., X_n=i) = P(X_{n+1} = j | X_n=i)
  • 전이 확률 행렬 (PP): P=[pij]P = [p_{ij}]이며, pij=P(Xn+1=jXn=i)p_{ij} = P(X_{n+1}=j | X_n=i)이다. PP확률 행렬 (Stochastic matrix)이다 (모든 행의 합이 1),.
  • n-단계 전이: nn단계 후의 상태 분포 an\mathbf{a}_n은 초기 분포 a0\mathbf{a}_0PPnn제곱을 이용하여 구한다.
    an=a0Pn\mathbf{a}_n = \mathbf{a}_0 P^n,
  • 정상 분포 (π\pi, Stationary Distribution): 시간이 지나도 분포가 변하지 않는 상태.
    π=πP\mathbf{\pi = \pi P} (단, πi=1,πi0\sum \pi_i = 1, \pi_i \ge 0)
    • 이는 유입 균형 방정식 (Flow Balance Equation)과 같다.
  • 수렴 정리 (Irreducible + Aperiodic): 유한 상태 DTMC가 기약적(Irreducible)이고 비주기적(Aperiodic)이면, 극한 확률 limnPijn=πjlim_{n\to\infty} P^n_{ij} = \pi_j가 존재하고, 이 값은 유일한 정상 분포 π\pi와 같다.

2. 연속 시간 마르코프 연쇄 (CTMC)

  • CTMC의 정의: 연속 시간 상에서 마르코프 속성을 만족하는 확률 과정.
  • 특징: 상태 전이까지의 시간은 지수 분포를 따른다,.
  • 레이트 행렬 (GG, Generator Matrix):
    • GG 행렬의 각 행의 합은 0이다.
    • GG 행렬의 비대각 원소 gijg_{ij} (iji \ne j)는 상태 ii에서 jj로의 전이율이다.
  • 정상 분포 (π\pi): πG=0\pi G = 0을 만족하고 πi=1\sum \pi_i = 1인 분포.
  • CTMC 전이 행렬 P(t)P(t): tt시간 후 상태 ii에서 jj로의 전이 확률을 담고 있으며, 다음과 같이 계산된다,.
    P(t)=etGP(t) = e^{tG}

V. 포아송 과정 (Poisson Process, PP)

개념정의 및 공식
포아송 과정 PP(λ)PP(\lambda)N(t)N(t)는 계수 과정이며, 겹치지 않는 구간에서의 증가는 독립이며, N(t2)N(t1)N(t_2) - N(t_1)λ(t2t1)\lambda(t_2 - t_1)을 매개변수로 하는 포아송 분포 Poi(λ(t2t1))Poi(\lambda(t_2-t_1))를 따른다,.
도착 간격 시간첫 도착 시간 T1T_1뿐만 아니라 연속적인 도착 간격 시간 TnT_n 모두 exp(λ)exp(\lambda) 분포를 따른다,. (지수 분포의 무기억 속성에 기인함).
병합 (Merging)독립적인 PP(λA)PP(\lambda_A)PP(λB)PP(\lambda_B)가 합쳐지면, PP(λA+λB)PP(\lambda_A + \lambda_B)가 된다.
세분화 (Thinning)PP(λ)PP(\lambda)에서 각 도착이 확률 ppAA를 선택하면, AA의 도착은 PP(pλ)PP(p\lambda)가 된다.
비균질 포아송 과정 (NHPP)도착률 λ\lambda가 시간에 따라 변하는 λ(t)\lambda(t) 함수를 사용하는 경우,.
NHPP 확률 계산구간 [s,t+s][s, t+s] 동안의 도착 횟수는 다음을 매개변수로 하는 포아송 분포를 따른다.
N(t+s)N(s)Poi(st+sλ(u)du)N(t+s) - N(s) \sim Poi\left(\int_{s}^{t+s} \lambda(u)du\right)
profile
push hard 🥕

0개의 댓글