내일 날씨, 주식의 등락, 스포츠 경기의 승패처럼 우리의 일상에 큰 영향을 미치지만, 실제로 일이 일어나기 전에는 결과가 불확실한 사례들이 많다. 기상청에서 일기 예보를 해도 틀리는 경우가 많고, 반드시 오를 거라 생각한 종목이 속절없이 떨어지는 경우가 부지기수다. 이런 불확실성을 "그나마 가능한 한도"에서 수학적으로 탐구하기 위한 학문이 확률론이다. 그리고 확률론의 기저에는 확률 시행이라는 개념이 있다.
확률 시행은 앞의 사례처럼,
1. 실제로 일이 일어나기 전까지 결과가 불확실함
2. 그래도 일어날 수 있는 결과는 이미 모두 알고 있음
두가지 조건을 만족하는 실험/현상/사례 등을 의미한다. 내일 날씨는 정확히 모르지만 비가 오거나 오지 않거나 둘 중 하나고, 주식도 오르거나 그대로거나 내려가는 세 결과 중 반드시 하나에 속한다. 확률론은 이런 확률 시행의 불확실성을 수학적으로 분석하는 것을 목표로 한다.
표본 공간은 확률 시행의 결과를 모두 모아 놓은 집합을 의미한다. 주로 로 표기한다.
예를 들어 내일 날씨의 표본 공간은 으로 생각할 수 있다.
그러나 꼭 이렇게 분류할 필요는 없다.
좀 더 자세하게 내일 비의 대한 정보를 분류할 수도 있기 때문이다.
그러나 표본 공간을 어떻게 정하든 다음 규칙은 지켜야 한다.
1. 표본 공간은 확률 시행의 모든 경우의 수를 담고 있어야 함
2. 각 결과는 동시에 일어날 수 없음 (반드시 표본 공간의 결과 중 하나만 일어나야 함)
위의 예시는 잘 정의된 표본 공간이라고 할 수 있다. 왜냐하면 비가 얼마나 오든지 셋 중 하나의 사례에 해당하고, 10ml 이하로 오면서 10ml 초과로 오는 등의 사례는 발생할 수 없기 때문이다.
표본공간을 잘 정의하기 위해서는 언어보다는 개수, 측량, 구간 등 확실한 기준이 있는 숫자나 측도를 이용하는 것이 좋다.
주식을 살 때 보통 오를 것만 생각하지 내려갈 것을 생각하지는 않는다. "주식의 가격이 오르는 경우"만 관심이 있다는 뜻이다. 이처럼 전체 결과의 경우의 수 중 일부에만 관심이 있을 때, 사건 개념을 이용하면 편리하다.
사건의 수학적 정의는 표본 공간의 부분집합이다. 사건은 보통 A나 B처럼 알파벳 대문자로 표기한다.
중요한 것은 표본 공간과 마찬가지로 사건도 집합이라는 점이다. 사건을 보통 자연어로 정의하다 보면 이 점을 망각하기도 하는데 계산에 있어서는 중요하니 기억해야 한다.
예를 들어 위의 표본 공간에 대해 사건 A를 "비가 30ml보다 많이 오는 경우"로 정의하자.
이 경우 A의 언어적인 정의에만 집중하다 보면 수학적으로 A를 어떻게 사용해야 할지 감이 오지 않는 경우가 많다. 그러나 A도 결국 표본 공간의 부분집합이라는 것을 생각하면,
이라는 부분집합으로 정의를 할 수 있다. 사건의 본질은 "집합"이며, 언어적인 정의는 집합을 쉽게 받아들이기 위한 부가적인 설명일 뿐이다.
위의 예시에서는 A는 원소가 하나 뿐인 집합이었지만, A를 "비가 10ml 보다 많이 오는 경우"로 정의하면 부분 집합이라는 사건의 정의가 더욱 와 닿는다.
우리가 관심있는 것은 비가 10ml보다 많이 오는 경우이기에, 표본 공간의 원소들 중 이 조건에 부합하는 원소들을 모두 A에 집어넣는다. 그리고 조건을 만족하지 않는 원소들은 여집합에 집어넣는다.
사실 사건을 언어로 정의하는 것은 사건을 집합으로 바라보는 것과 보완적인 관계다.
A를 "비가 10ml 보다 많이 오는 경우"로 정의하면 비가 11ml 오는 사례, 12ml 오는 사례, 13ml 오는 사례 ... 를 모두 생각할 필요가 없어진다. 그냥 "10ml보다 많이 옴"이라는 사실 하나로 모든 자세한 사례들이 통합되기 때문이다.
따라서 사건의 언어적 정의는 매우 복잡한 표본 공간도 사건이라는 "기준"을 통해 단순화 할 수 있게 해준다.
사건의 두 정의, 언어적 정의와 이에 따른 집합을 이용한 정의는 각각 복잡한 표본 공간의 단순화, 시행 결과들의 엄밀한 수학적 분류라는 각각의 장점을 가지고 있다. 이들은 상호보완적으로 시행의 분석을 돕는다.
어떤 사건이 일어났다는 것은, 시행의 결과가 사건 집합에 속한다는 것이다.
예를 들어 위의 예시에서 사건 A가 발생했다는 것은 내일 비가 10ml 초과 30ml 이하로 오거나, 30ml 초과해서 오는 경우를 의미한다.
헷갈리지 말아야 하는 것은 사건 A가 일어났다고 해서 다른 모든 사건이 일어나지 않는 것은 아니라는 점이다.
예를 들어 사건 B를 비가 10ml 초과 30ml 이하로 오는 사건으로 정의하자.
그리고 실제로 내일 비가 20ml가 왔다면, 먼저 이 결과는 사건 A의 을 만족하므로 사건 A는 발생한다.
하지만 이는 사건 B를 만족하는 것이기도 하므로 사건 B도 발생한다고 할 수 있다.
따라서 사건의 발생을 따질 때는 단순하게 각 사건 집합에 결과가 속하는 지만 확인하면 된다.