다변량 확률 분포 : 정의와 결합 확률 함수

STATS·2023년 6월 21일
0

수리통계학

목록 보기
8/40

한 확률 시행을 여러 관점에서 바라보기

확률 변수는 표본 공간의 사건들을 연구자의 관심에 맞게 숫자로 재구성하는 기준의 역할을 한다.
그런데 보통 한 실험에 대해 오직 하나의 관심을 가지는 경우는 적을 것이다.

예를 들어 학생의 수능 성적을 표본 공간으로 하는 확률 시행을 한다고 하자. 그렇다면 표본 공간 Ω\Omega는 다음과 같이 설정할 수 있다. 각각 K, M, E는 국어, 수학, 영어 점수다.

Ω={(K,M,E)0K100,0M100,0E100}\Omega = \{(K, M, E)|0 \le K \le 100, 0 \le M \le 100, 0 \le E \le 100 \}

이 때 확률 변수 XX를 학생의 수학 점수라고 정의하면, 국어/영어 점수에 관계 없이 표본 공간은 각 수학 점수로 분할되어 확률 변수를 구성하게 된다.

다른 확률 변수 YY를 학생의 영어+국어 점수라고 정의하면, 수학 점수에 관계 없이 표본 공간은 영어 점수와 국어 점수의 합으로 분할되어 확률 변수를 구성한다.

즉 같은 확률 시행, 같은 표본 공간을 확률 변수를 이용해 다르게 분할한 것이다.
여러 확률 변수를 이용하면 동일한 시행을 다양한 각도에서 분석하고, 확률 변수 간의 관계를 파악하는 데도 용이하다.

예를 들면 X>80,Y>90X > 80, Y > 90이면 언어와 수리적인 능력이 모두 뛰어난 학생, X<50,Y>95X < 50, Y > 95이면 언어적인 영역은 뛰어나지만 수리적인 능력은 부족한 학생 등으로 학생의 학습 능력을 평가할 수 있을 것이다.

확률 벡터

동일한 표본 공간 Ω\Omega에 대한 여러 확률 변수 X1,X2,...,XnX_1, X_2, ..., X_n이 있을 때, 확률 변수의 값들을 묶은 (X1,X2,...,Xn)(X_1, X_2, ..., X_n)을 확률 벡터라고 한다.
(X1,X2,...,Xn)(X_1, X_2, ..., X_n)의 서포트는 {(x1,x2,...,xn)xi=Xi(s),1in,sΩ}\{(x_1, x_2, ..., x_n) \lvert x_i = X_i(s), 1 \le i \le n, s \in \Omega\}가 된다.

(X1,X2,...,Xn)(X_1, X_2, ..., X_n)의 서포트는 Rn\R^n 전체 혹은 부분 집합이 된다

위의 예시에서는 (X,Y)(X, Y)를 확률 벡터로 생각할 수 있다.
이 확률 벡터의 서포트는 {(x,y)x=X(s),y=Y(s),0s100}\{(x, y) \lvert x = X(s), y = Y(s), 0 \le s \le 100\}가 된다.
(X,Y)(X, Y)의 서포트는 XXYY를 축으로 하는 2차원 평면의 일부가 된다.

결합 확률 함수

결합 확률 함수는 다변량 확률 벡터에 확률을 부여하는 확률 함수다.
예를 들어 위의 예시에서 P(X=76,Y=80)P(X = 76, Y = 80)P(X=100,Y=100)P(X=100, Y = 100)은 차이가 날 것이다.

또는 결합 확률 함수를 입력으로 벡터를 받아 0과 1 사이의 실수를 반환하는 함수로 생각할 수도 있다.

결합 확률 함수의 조건

결합 확률 함수는 다음의 조건을 만족해야 한다.

  1. fX1,X2,...,Xn(x1,x2,...,xn)0f_{X_1, X_2, ..., X_n}(x_1, x_2, ..., x_n) \ge 0
  2. ...fX1,X2,...,Xn(x1,x2,...,xn)dx1...dxn=1\int_{-\infin}^{\infin}...\int_{-\infin}^{\infin} f_{X_1, X_2, ..., X_n}(x_1, x_2, ..., x_n)dx_1...dx_n =1

0개의 댓글