[확률통계] Random Variable, Probability Function, Probability Distribution

JAEYOON SIM·2021년 8월 10일
post-thumbnail

Probability Space

확률 공간(Probability Space)은 표본 공간 Ω, 사건 공간 F, 확률 측도 P로 구성되는 전체 공간을 이야기하며, 표기법으로는 통상적으로 (Ω, F, P)로 표기한다.

1. 표본 공간(Sample Space) Ω: 표본 추출이나 확률 실험 등을 통해서 얻어지는 모든 가능한 결과들이다. 현실적으로 쉽게 얻기 어려운 모집단이 아닌, 실험으로 이루어진 집단이다. 예시로 주사위를 보면, Ω = {1, 2, 3, 4, 5, 6}인 셈이다.
2. 사건 공간(Event Space) F: 표본 공간의 부분 집합으로 확률 실험 결과로부터 가능한 모든 조합에 의해 만들어지는 공간이다. 주사위의 결과 중 홀수는 F = {1, 3, 5}, 짝수는 F = {2, 4, 6}인 셈이다.
3. 확률 측도(Probability Measure) P: 전체 중의 부분 집합에 숫자를 대응시키는 함수이다. P(홀수) = 1/3, P(짝수) = 1/3인 셈이다.

Random Variable

확률 변수(Random Variable)은 무작위 실험을 하게 되었을 때, 특정 확률로 발생하는 각각의 결과를 수치적인 값으로 표현하는 변수이다. 일상어로 이야기하면 운에 따라 왔다갔다하는 확정되지 않은 양이다.
우리가 동전을 던졌을 때, 윗면이 나올 수도 있고 뒷면이 나올 수도 있다. 확률 변수는 이렇게 동전을 던지는 실험을 했을 때 일정한 확률을 가지고 발생하는 결과에 실수 값을 부여하는 변수를 말한다. 관례적으로 확률 변수는 대문자를 사용한다.
확률 변수의 종류에는 이산 확률 변수(Discrete Random Variable)과 연속 확률 변수(Continuous Random Variable)이 있다.

  • 이산 확률 변수: 확률 변수 X가 어느 구간의 모든 값들을 취하는 것이 아닌, 1, 2, ... 와 같이 쉽게 말하자면 정수와 같은 고립된 결과를 선택하는 변수이다.
  • 연속 확률 변수: 고립된 결과가 아닌 연속적인 구간으로 나타나는 확률 변수를 말한다. 쉽게 말하자면 실수 범위를 포함한다고 생각하면 된다.

이산 확률 변수와 같이 끊어지고 구분된 변수가 있는 반면에, 연속 확률 변수와 같이 연속적으로 이어진 변수가 있는 것이다. 이는 상황에 따라 다르기 때문에 구분할 줄 알아야 한다.

Probability Function

확률 함수(Probability Function)은 확률 변수에 의해 정의된 실수를 확률 0~1 사이에 대응시키는 함수를 말한다. f(x) = P(X = x)와 같이 사용할 수 있으며, 이러한 방식의 확률 함수는 위에서 정의한 이산 확률 변수와 연속 확률 변수 모두에 사용이 가능하다. 하지만, 연속 확률 변수의 경우에는 확률 함수로 표현되는 확률이 0이기 때문에 사실상 큰 의미가 없어 보통은 이산 확률 변수에 대해서만 사용하고 있다.

Probability Distribution

확률 분포(Probability Distribution)은 확률 변수의 모든 값과 그에 대응하는 확률들이 어떻게 분포하고 있는지를 말한다. 우리는 확률 변수와의 차이를 주의해야 하는데, 확률 변수는 어떤 세계에서 어떤 값이 나오는지를 정하는데 반해 확률 분포는 어떤 세계인지까지는 정하지 않는다. 그런데 확률 변수가 주어지면 그 확률 분포를 계산할 수 있다. 만약 X와 Y의 확률 분포가 다음과 같다고 해보자.
X와 Y는 다른 확률 변수이지만, 확률 분포는 위와 같이 같을 수 있다.

확률 변수, 확률 함수, 확률 분포의 관계를 정리하면 다음과 같다.

profile
평범한 공대생의 일상 (글을 잘 못 쓰는 사람이라 열심히 쓰려고 노력 중입니다^^)

0개의 댓글