저번 글에서는 principle 5에 대해서 다루어보았습니다. 이번 글에서는, random 객체 중 하나인 random variable에 대해 다루어볼까 합니다.
Random variable이란?
확률 공간 (R,P(R),P)으로 정의할 수 있는 random한 객체를 우리는 random variable이라고 합니다. 즉, 어떤 random한 객체의 outcome이 항상 실수의 형태라면, 그 객체는 random variable이라고 할 수 있습니다.
이 random variable은, 다른 random 객체와는 다르게 cumulative probability distribution function(CDF)이 unique하게 존재합니다. Uniqueness에 대한 증명은 다음에 기회가 되면 다루도록 하겠습니다. 즉 CDF는 특정한 set A∈P(R)들에 대한 probability measure이며 다음과 같이 정의가 가능합니다.
FX(x)=P({X∣X≤x})
이러한 distribution function은 다음과 같은 6가지 성질을 만족합니다. 이번 글에서는 이 6가지 성질에 대한 증명을 하고, 글을 마치겠습니다.
(1): limx→−∞FX(x)=0;
(2): limx→∞FX(x)=1;
(3): 0≤FX(x)≤1;
(4): FX(x1)≤FX(x2)ifx1<x2;
(5): P({x1<x≤x2})=FX(x2)−FX(x1);
(6): FX(x+)=FX(x);
(1): Prove that
x→−∞limFX(x)=0;
Proof)
Lemma: Let [xn]n∈N be an arbitrary decreasing sequence with limn→∞xn=−∞; Then ∩n=1∞(−∞,xn]=∅;
Proof of lemma)
Let ∩n=1∞(−∞,xn]=∅ where ∃x∈∩n=1∞(−∞,xn];
Then ∃k∈N:xk<x because xn→−∞;
Since x∈(−∞,xk] for some k∈N, so x∈∩n=1∞(−∞,xn], which contradicts the fact that x∈∩n=1∞(−∞,xn];
Hence ∩n=1∞(−∞,xn]=∅;
Also, we can say that ∩n=1m(−∞,xn]=(−∞,xm] for any m∈N;
So, by Measure of Limit of Increasing Sequence of Measurable Sets:
limm→∞FX(xm)=limm→∞P((−∞,xm])=limm→∞P(∩n=1m(−∞,xn])=P(∅)=0;
Because [xn]n∈N was an arbitrary decreasing real sequence, we can conclude that limx→−∞FX(x)=0■
(2): Prove that
x→∞limFX(x)=1;
Proof)
Let [xn]n∈N be an increasing sequence with limn→∞xn=∞;
Then:
∪n=1∞(−∞,xn]=R
□
From Measure of Limit of Increasing Sequence of Measurable Sets, P(∪n=1∞(−∞,xn])=limn→∞P((−∞,xn]).
Thus,
1=P(R)=P(∪n=1∞(−∞,xn])=n→∞limP((−∞,xn])=n→∞limFX(xn)
□
Since [xn]n∈N was arbitrary,
x→∞limFX(x)=1
■
(3): Prove that
0≤FX(x)≤1;
Proof)
FX(x)=P((−∞,x])forx∈R;
We know thtat for any a∈P(R):
0≤P(a)≤1;
Hence 0≤P(a)≤1;
■
(4): Prove that
FX(x1)≤FX(x2)ifx1<x2;
Proof)
Let A=(−∞,x1] and B=(−∞,x2] where P(A)=FX(x1) and P(B)=FX(x2);
Then B∖A=(x1,x2];
Thus:
FX(x2)=P(B)=P(A∪(B∖A))=P(A)+P(B∖A)=FX(x1)+P(B∖A)whereP(B∖A)≥0
Hence, FX(x1)≥FX(x2)
■
(5): Prove that
P({x1<x≤x2})=FX(x2)−FX(x1);
Proof)
Let A=(−∞,x1] and B=(−∞,x2] where P(A)=FX(x1) and P(B)=FX(x2);
Then B∖A=(x1,x2] where:
FX(x2)=P(B)=P(B∖A)+P(A)=P((x1,x2])+FX(x1)
Hence we can conclude that:
P((x1,x2])=FX(x2)−FX(x1)
■
(6): Prove that
FX(x+)=FX(x);
Proof)
For any a∈R, let [xn]n∈N be an arbitrary decreasing sequence where
n→∞limxn=a;
And we define a set: An={x∣x≤xn} where An∈P(R);
Lemma: ∩n=1∞An={x∣x≤a};
Proof of lemma)
(⇒) For m∈R, ∀α∈Am: let α>a;
Then ∃xk:k>m where α>xk≥a because limn→∞xn=a;
Thus we can conclude that ∄α∈∩n=1∞An where α>a;
Hence we can conclude that ∩n=1∞An⊂{x∣x≤a};
(⇐) Let α∈{x∣x≤a};
For each m∈N:a≤xm;
Hence {x∣x≤a}⊂∩n=1∞An
□
So, for any decreasing sequence [xn]n∈N, limn→∞xn=a:
FX(a+)=n→∞limFX(xn)=P(∩n=1∞An)=P({x∣x≤a})=FX(a)
for any a∈N;
Hence we can conclude that FX(a+)=FX(a),∀a∈R
■
Conclusion
지금까지 CDF와 그 성질에 대해 살펴보았습니다. CDF는 probability measure을 represent할 수 있는 함수이고, 위에서 증명한 6가지 성질을 만족합니다. 이 중 1, 2, 4 그리고 6번은 주어진 함수가 유효한 distribution function인지 분별하는데 사용되기도 합니다. 다음으로 우리가 할 것은 CDF가 미분 가능하고 그 도함수가 연속일 때(혹은 유한한 곳에서 불연속이고 piecewise continuous 할 때), density function을 구하고, 이 density function은 어떤 성질을 만족하는지에 대해 살펴보겠습니다. 지금까지 긴 글 읽어주셔서 감사합니다!