한 확률 시행을 여러 관점에서 바라보기
확률 변수는 표본 공간의 사건들을 연구자의 관심에 맞게 숫자로 재구성하는 기준의 역할을 한다.
그런데 보통 한 실험에 대해 오직 하나의 관심을 가지는 경우는 적을 것이다.
예를 들어 학생의 수능 성적을 표본 공간으로 하는 확률 시행을 한다고 하자. 그렇다면 표본 공간 Ω는 다음과 같이 설정할 수 있다. 각각 K, M, E는 국어, 수학, 영어 점수다.
Ω={(K,M,E)∣0≤K≤100,0≤M≤100,0≤E≤100}
이 때 확률 변수 X를 학생의 수학 점수라고 정의하면, 국어/영어 점수에 관계 없이 표본 공간은 각 수학 점수로 분할되어 확률 변수를 구성하게 된다.
다른 확률 변수 Y를 학생의 영어+국어 점수라고 정의하면, 수학 점수에 관계 없이 표본 공간은 영어 점수와 국어 점수의 합으로 분할되어 확률 변수를 구성한다.
즉 같은 확률 시행, 같은 표본 공간을 확률 변수를 이용해 다르게 분할한 것이다.
여러 확률 변수를 이용하면 동일한 시행을 다양한 각도에서 분석하고, 확률 변수 간의 관계를 파악하는 데도 용이하다.
예를 들면 X>80,Y>90이면 언어와 수리적인 능력이 모두 뛰어난 학생, X<50,Y>95이면 언어적인 영역은 뛰어나지만 수리적인 능력은 부족한 학생 등으로 학생의 학습 능력을 평가할 수 있을 것이다.
확률 벡터
동일한 표본 공간 Ω에 대한 여러 확률 변수 X1,X2,...,Xn이 있을 때, 확률 변수의 값들을 묶은 (X1,X2,...,Xn)을 확률 벡터라고 한다.
(X1,X2,...,Xn)의 서포트는 {(x1,x2,...,xn)∣xi=Xi(s),1≤i≤n,s∈Ω}가 된다.
즉 (X1,X2,...,Xn)의 서포트는 Rn 전체 혹은 부분 집합이 된다
위의 예시에서는 (X,Y)를 확률 벡터로 생각할 수 있다.
이 확률 벡터의 서포트는 {(x,y)∣x=X(s),y=Y(s),0≤s≤100}가 된다.
즉 (X,Y)의 서포트는 X와 Y를 축으로 하는 2차원 평면의 일부가 된다.
결합 확률 함수
결합 확률 함수는 다변량 확률 벡터에 확률을 부여하는 확률 함수다.
예를 들어 위의 예시에서 P(X=76,Y=80)과 P(X=100,Y=100)은 차이가 날 것이다.
또는 결합 확률 함수를 입력으로 벡터를 받아 0과 1 사이의 실수를 반환하는 함수로 생각할 수도 있다.
결합 확률 함수의 조건
결합 확률 함수는 다음의 조건을 만족해야 한다.
- fX1,X2,...,Xn(x1,x2,...,xn)≥0
- ∫−∞∞...∫−∞∞fX1,X2,...,Xn(x1,x2,...,xn)dx1...dxn=1