확률 및 통계 (12)

이성준·2023년 7월 26일

replit
MatLAB -> 무거운 -> 온라인으로 쓰는게 빠름
-> 데이터 시각화에 유리함

컴퓨터에서 난수 생성

컴퓨터(Computer)?

회로의 전기적 신호의 유무 (ON / OFF)로 데이터 처리 (계산)
입력(Input)에 대한 출력(Output)을 계산
일반적인 컴퓨터는 기본적으로 난수(random number)를 만들 수 없다.
의사 난수 (Pseudorandom number, PRN)
-> 컴퓨터에서는 실제 난수가 아니라 난수와 매우 유사한 수열(Sequence)을 생성
-> 의사난수생성기 (PRN generator, PRNG): 여러 알고리즘이 존재
의사 난수 생성 알고리즘 (PRN generator, PRNG)

균등 분포의 보편성 (1/3)

연속확률변수 X와 X의 CDF Fx(x)에 대해서, Y = G(x) = Fx(x)
확률변수 Y는 항상 0과 1 사이의 균등분포 (uniform distribution)가 된다.
확률적분변환 (Probability integral transform)으로 불림
주의 : 확률변수 Y는 X의 함수변환 -> y = G(x) = Fx(x)
증명 : Fy(y) = Pr[Y <= y] = Pr[Fx(x) <= y] = Pr[X <= Fx^(-1)(y)] = Fx(Fx^(-1)(y)) = y

-> y의 범위는 0과 1사이 Pr[Y<=y] = y는 균등분포를 의미

연속확률변수 X의 분포를 따르는 난수 생성

(1) 0과 1사이에서 균등하게 분포하는 난수생성 -> yn

(2) xn = Fx^(-1)(yn) -> xn은 X의 분포를 따른다.
-> yn = Fx(xn) -> (역함수 관계)

(실습 #2) 특정확률분포를 따르는 난수생성

Fx(x) = 1 - exp(-x²/2)
fx(x) = x * exp(-x²/2), 0 <= x < ∞

생각해볼 점

가우스 확률분포를 따르는 난수생성

표준정규분포 z를 따르는 난수생성 방법
(방법 1) 균등분포의 보편성 이용

U : 표준(0과 1사이) 균등확률변수 -> uk 특정샘플(난수) 생성
zk = Fz^(-1)(uk) 생성 -> 생성된 샘플(난수) zk는 Z의 분포를 따른다.
주의! z의 CDF의 역함수 (Fz^(-1)(z))을 구하는 것이 어렵다.
-> 그럼 어떻게? CDF또는 CDF의 역함수의 근사(approximation) 함수를 이용

(방법 2) Box_Muller 방법

가우스 확률변수 쌍과 상관계수
(복습) 결합가우스 확률변수

X~N(µx, σ²x), Y~N(µy, σ²y)가 각각 가우스 확률변수
ρx,y : 두 확률변수의 상관계수
(X, Y)의 결합확률밀도함수 (joint PDF)
(복습) 공분산 (covariance)
cov[X, Y] = E[(X-mx) (Y-my)] = E[XY] - E[X] * E[Y]
(복습) 상관계수 (correlation coefficent)
특정 상관계수 값(ρ)을 가지는 표준정규분포 (평균 0, 분산 1) 쌍 생성 방법
독립인 두 가우스 확률변수의 합
X~N(µx, σ²x), Y~N(µy, σ²y)
-> Z = X + Y(µx + µy, σ²x + σ²y)
-> 여기서 X, Y는 독립
-> 독립일 경우, 두 가우스 확률변수의 합은 여전히 가우스 확률변수이다.
-> Z, X는 독립? No. (Z, Y)도 마찬가지