Statistics - 확률(Probability) 1
HALF1007 통계학(수학과 배윤한 교수님) 수업을 듣고 정리했습니다.
목차
- 확률에 관한 기본 용어
- 확률실험 / 표본공간 / 사건 / 근원사건 / 공사건
- 합사건 / 곱사건 / 여사건 / 배반사건 / 쌍마다 배반사건
- 확률에 대한 두 가지 관점
- 수학적 확률 (등확률 모델)
- 통계적 확률 (경험적 확률)
- 공리적 확률
- 여러가지 확률 문제
- 생일문제 / 가능성 트리 / 파스칼 문제 / 갈릴레오 문제
확률에 관한 기본 용어
확률실험 (random experiment)
확률실험이란, 결과를 미리 알 수 없지만 가능한 모든 결과는 예측 가능하고, 동일한 조건에서 반복 가능한 실험이다.
확률실험이 되기 위한 필요조건 세 가지:
- 모든 결과를 예측 가능해야 한다.
- 시행 전에는 결과를 알 수 없다.
- 동일한 조건에서 반복이 가능해야 한다. (재현성)
예) 동전 던지기, 주사위 던지기 등
표본공간 (sample space)
표본공간이란, 확률실험에서 나타날 수 있는 모든 결과들의 집합이다.
- 집합이므로 중복이 없다.
- 복원 추출이냐, 비복원 추출이냐에 따라 표본공간이 달라질 수 있다.
예) 두 개의 주사위를 던지는 시행에서
S={(1,1), (1,2), ⋯, (6,6)} → 총 36개의 원소
사건 (event)
사건이란, 표본공간의 부분집합이다.
예) 동전 던지기 → S={앞,뒤}
주사위 던지기 → S={1,2,3,4,5,6}
근원사건 (elementary event / atomic event)
근원사건이란, 표본공간의 원소 단 하나로만 구성된 사건이다.
예1) 주사위 던지기 → {1}, {2}, {3}, {4}, {5}, {6}
예2) 동전 두 개 던지기 → {(앞,앞)}, {(앞,뒤)}, {(뒤,앞)}, {(뒤,뒤)}
공사건 (ϕ)
공사건이란, 결코 일어나지 않는 사건, 즉 공집합이다.
예) 주사위를 던질 때 눈의 수가 7이 나오는 경우
합사건 (A∪B)
A∪B 는 A 또는 B가 일어나는 사건, 즉 A와 B 중 적어도 하나가 발생하는 사건이다.
예) 주사위 던지기에서 소수의 눈 A={2,3,5}, 홀수의 눈 B={1,3,5} 라 할 때,
A∪B={1,2,3,5}
곱사건 (A∩B)
A∩B 는 A와 B가 동시에 일어나는 사건이다.
예) 위와 동일하게 정의하면,
A∩B={3,5} (소수이면서 동시에 홀수)
여사건 (Ac)
여사건 Ac 는 사건 A에 속하지 않는 모든 결과를 포함하는 사건, 즉 A가 일어나지 않을 사건이다.
예) 주사위에서 홀수가 나오는 사건의 여사건 → {2,4,6}
배반사건 (mutually exclusive / disjoint event)
배반사건이란, 두 사건의 교집합이 공집합인 경우다. 즉, 두 사건이 절대 동시에 일어날 수 없다.
A∩B=ϕ
예) A={1,3,5}, B={2,4,6} → A와 B는 배반사건
쌍마다 배반사건 (pairwisely-mutually exclusive events)
사건이 3개 이상 있을 때, 어떤 두 사건을 골라도 서로 배반인 경우를 쌍마다 배반사건이라 한다.
-
수학적 표기

-
쌍마다 배반사건 예시)

확률에 대한 두 가지 관점
확률이란, 하나의 사건이 일어날 수 있는 가능성을 수치로 나타낸 것이다.
사건 A가 일어날 확률을 P(A) 로 표기한다.
도수 관점 (frequency view) / 빈도 관점
- 어떤 사건의 확률 = 전체 경우의 수에 대한 그 사건이 일어나는 경우의 수(빈도수)의 비
- 관측된 빈도에 근거하므로 객관적으로 정의 가능하다.
- 빈도주의자(frequentist)의 관점 — 통계학의 main stream
주관적 관점 (subjective view)
- 사건에 대한 주관적 확신, 믿음의 정도로 확률을 정의한다.
- 주관적임에도 실용적으로 유용한 경우가 많다.
- 베이즈주의자(Bayesian)의 관점 — AI, ML, DL 분야에서 강력하게 활용되며 main stream을 넘보는 중
수학적 확률(등확률 모델)
수학적 확률이란, 표본공간의 각 근원사건이 일어날 가능성이 모두 동등할 때 적용하는 확률 모형이다.
정의
- N개의 결과로 구성된 표본공간 S={e1,e2,⋯,eN} 에서, 각 결과가 일어날 가능성이 동일하고 사건 A가 발생하는 결과가 m개일 때, P(A)=Nm 로 정의한다.

- 수학적 확률 모형의 필요조건과 예시

성질
- 0≤P(A)≤1
- 전사건에 대하여 P(S)=1
- 두 사건 A, B에 대하여 P(A∪B)=P(A)+P(B)−P(A∩B)
- A, B가 배반사건이면 P(A∪B)=P(A)+P(B)

수학적 확률(등확률 모델)은 근원사건이 일어날 가능성이 동일하다는 가정과, 표본공간의 원소 수가 유한 개일 때에만 정의된다. 이 조건을 만족하지 않는 경우에는 섣불리 적용해서는 안 된다.
통계적 확률(경험적 확률)
통계적 확률이란, 동일한 확률실험을 N번 반복할 때 사건 A가 발생한 횟수를 m이라 하면,
P(A)=m/N 으로 정의하는 경험에 근거한 확률이다.
- 각자의 경험에 따라 확률 값이 달라질 수 있다.
- Consensus를 이루기 위해서는 N수를 무한히 늘려야 할수도..
- 통계적 확률에서도 확률의 덧셈정리는 여전히 성립한다.
수학적 확률 vs 통계적 확률
| 수학적 확률 | 통계적 확률 |
|---|
| 기반 | 등확률 가정 | 실제 실험 결과 |
| 예시 | 공정한 동전: P(앞)=1/2 | 100번 던져 45번 앞면: P=45/100 |
| 한계 | 등확률 가정, 유한 표본공간 필요 | 매번 다를 수 있고, 무한 시행의 극한으로 정의 |
대수의 법칙 (Law of Large Numbers)
사건 A가 일어날 확률을 P라 할 때, 시행 횟수 N이 커질수록 상대도수 m/N은 P에 수렴한다.
공정한 동전을 던지는 실험에서 앞면이 나오는 상대도수를 관찰하면, 처음에는 불안정하지만 시행 횟수가 늘어날수록 1/2 에 점점 가까워지는 것을 확인할 수 있다.

공리적 확률
만약 동전이 공정하지 않다면?
수학적 확률 모형에서는 각 사건의 확률을 어떻게 정의해야 할까?

공리적 확률 모형은 "확률을 수학의 반열에 올려보려는 시도" 로,
다음 세 가지 공리(axiom)만 만족하면 확률로 인정하겠다는 모형이다.
공리적 확률의 정의(필요조건)
(1) S의 부분집합 A에 대하여: 0≤P(A)≤1
(2) 표본공간 S에 대하여: P(S)=1
(3) 가법성(additivity): 쌍마다 배반인 사건 A1,A2,⋯ 에 대하여,
P(⋃i=1nAi)=∑i=1nP(Ai)
가법성(additivity)
- 가법성은 확률이 비로소 측도(measure)임을 의미한다.
- n개의 합사건이 각 사건의 확률의 합과 같다는 것을 의미한다.

공리적 확률의 성질과 증명
(1) P(ϕ)=0
S=S∪ϕ 이고, 둘은 배반이므로 가법성에 의해, P(S)=P(S)+P(ϕ)
∴ P(ϕ)=0

(2) P(Ac)=1−P(A)
S=A∪Ac 이고, 둘은 배반이므로, P(S)=P(A)+P(Ac)=1
∴ P(Ac)=1−P(A)

(3) A⊂B 이면, P(A)≤P(B)
B=A∪(B∩Ac) 이고, 둘은 배반이므로,
P(B)=P(A)+P(B∩Ac)≥P(A)
(∵P(B∩Ac)≥0)

(4) 임의의 두 사건 A, B에 대하여 (덧셈정리)
P(A∪B)=P(A)+P(B)−P(A∩B)
A∪B=A∪(B∩Ac) (배반)로 나누면, P(A∪B)=P(A)+P(B∩Ac)
B=(A∩B)∪(B∩Ac) (배반)이므로, P(B)=P(A∩B)+P(B∩Ac)
따라서, 두 식을 정리하면 위의 결과를 얻는다.

(5) P(A∪B)≤P(A)+P(B)
- 성질 3과 성질4에 따라서, 교집합의 확률 P(A∩B)≥0 이므로,
성질 3의 증명과 같은 방식으로 증명가능하다.
(6) 포함-배제 원리 (Inclusion-Exclusion Principle)
P(A∪B∪C)=P(A)+P(B)+P(C)−P(A∩B)−P(B∩C)−P(A∩C)+P(A∩B∩C)
- 포함-배제 원리란, 전체의 확률을 구할 때 일단 다 더하고(포함), 겹치는 부분을 빼는(배제) 과정을 반복해서 정확한 값을 구하는 방법이다. 성질 (4)와 (6)이 이에 해당한다.
- 핵심은 집합을 배반인 사건들로 잘 나누는 것
- (A∪B)를 D로 놓으면 성질 (4)의 증명과 동일한 방식으로 유도된다.
공리적 확률 예시
Q) 세 명의 아이가 있는 가정에서 성별에 대해 두 가지 표본공간이 제시되었다. (B: 소년, G: 소녀)
S1={BBB, BBG, BGB, GBB, BGG, GBG, GGB, GGG}
S2={0B, 1B, 2B, 3B}
S1은 출생 순서에 의해, S2는 소년의 수에 의해 정의된 표본공간이다.
두 개의 표본공간이 어떻게 다른지 설명하시오.
- 동일한 확률공간에 대해 여러 개의 표본공간이 정의될 수 있다.
- S1은 각 근원사건의 확률이 1/8로 동일 → 등확률 모델 적용 가능
- S2는 각 근원사건의 확률이 다름 (예: 0B의 확률 = 1/8, 1B의 확률 = 3/8) → 등확률 모델 적용 불가
여러가지 확률 문제
수학적 확률을 바로 적용할 수 있는지, 즉 등확률 가정이 성립하는지에 집중해서 보자.
생일문제 (Birthday Paradox)
Q1) n명의 사람이 한 교실에 모여 있을 때, 그 중 생일이 같은 두 명 이상이 존재할 확률 P(n)은?
여사건을 이용해서 구하는 것이 편하다.
P(n)=1−P(모두 다른 생일)=1−365n365×364×⋯×(365−n+1)
직관과 달리, n=23 이면 P(n)>0.5 를 넘어선다. 생각보다 훨씬 빨리 확률이 올라간다.


가능성 트리 (Possibility Tree)
Q2) A, B 두 팀 중 어느 한 팀이 연속 2회 이기거나 또는 총 3회 이기면 승리한다.
(이길 확률은 50%라고 가정한다.)

(1) 가능한 토너먼트 진행 방법은 몇 가지인가?
가능성 트리를 그리면 총 10가지 경우가 존재한다.
(2) 5게임이 필요할 확률은?
5게임으로 끝나는 경우는 4가지이다.
잘못된 풀이) 4/10 → 각 경우가 동일한 확률을 갖는다는 가정은 틀렸다.
2게임 만에 끝나는 경우와 5게임에 끝나는 경우의 확률은 다를 수 밖에 없다.
올바른 풀이) 각 게임은 독립이고 확률이 1/2 이므로,
P(5게임 필요)=4×(21)5=324=81
수학적 확률(등확률 모델)을 적용할 때는 각 경우의 수가 동일한 확률을 갖는지 반드시 확인해야 한다.
메레가 파스칼에게 낸 문제 (도박사 파스칼 문제)
Q3) 상금은 64만원. 3번을 먼저 이기는 사람이 상금을 가져가기로 했는데,
메레가 2번, 상대방이 1번 이긴 상황에서 게임이 중단되었다.
상금을 어떻게 나누어야 하는가?
두 사람이 합의한 조건: 이길 수 있는 가능성의 정도에 따라 상금을 나눈다.
상대방의 주장
메레가 2/3을 가져가고, 자신이 1/3을 가져가야 한다.
이미 이긴 횟수만 반영하고 미래의 가능성을 전혀 고려하지 않은 것이다.
만약 100번을 먼저 이기는 조건이라면 이 주장은 더욱 말이 안 된다.
파스칼의 주장
다음 시합에서 메레가 이기든 지든, 메레는 최소 32만원을 확보한 셈이다.
이후의 나머지 32만원을 각각 50%로 나누면, 메레는 32+16=48만원을 받아야 한다.
- 메레가 다음 시합에서 이길 경우: 64만원 (게임 종료)
- 메레가 다음 시합에서 질 경우: 이후 Q3의 상황이 되어 메레가 가져갈 기댓값은 32만원
→ 최소 32만원은 보장, 나머지 32만원은 반반 → 메레 32+16=48만원
페르마의 주장
이후 남은 시합의 경우를 모두 열거하면:
1. 메레 승 (O) → 확률 1/2
2. 메레 패, 메레 승 (XO) → 확률 1/4
3. 메레 패, 메레 패 (XX) → 확률 1/4
메레가 이기는 경우는 ①, ②이므로:
P(메레 최종 우승)=21+41=43
∴메레 몫=64×43=48만원
Q4) 위 조건에서 메레가 2번, 상대방이 0번 이긴 상태에서 게임이 중단되었다.
상금을 어떻게 나누어야 하는가?
파스칼의 주장
이후 남은 시합의 경우를 모두 열거하면, 메레가 이길 확률 = 7/8, 상대방이 이길 확률 = 1/8 (세 판을 모두 이겨야 하므로).
∴메레 몫=64×87=56만원
페르마의 주장
- 다음 시합에서 메레가 이기면 → 게임 종료, 64만원 (확률 1/2)
- 다음 시합에서 메레가 지면 → Q3의 상황(메레 2승 상대 1승)이 되므로, 메레의 기댓값 = 48만원 (확률 1/2)
E=21×64+21×48=32+24=56만원
갈릴레오가 도박사 친구로부터 받은 질문
Q5) 3개의 주사위를 동시에 던졌을 때, 눈의 합이 9가 되는 경우와 10이 되는 경우의 조합 수는 각각 6가지로 같다. 그런데 실제로는 합이 10이 될 확률이 더 큰 이유는 무엇인가?
(1) 눈의 합 = 9: (1,2,6), (1,3,5), (1,4,4), (2,2,5), (2,3,4), (3,3,3)
(2) 눈의 합 = 10: (1,3,6), (1,4,5), (2,2,6), (2,3,5), (2,4,4), (3,3,4)
조합은 6가지로 같지만, 각 조합이 실제로 나타나는 근원사건의 수(순서 고려) 가 다르다. 예를 들어 (1,2,6)은 배열 방법이 3!=6가지지만, (3,3,3)은 1가지뿐이다.
| 합 | 총 근원사건 수 (순서 고려) | 확률 |
|---|
| 9 | 6+6+3+3+6+1=25 | 25/216 |
| 10 | 6+6+3+6+3+3=27 | 27/216 |
∴P(합=10)>P(합=9)
이번 블로그에서 가장 많이 언급한 내용이지만, 마지막으로 또 한번 강조하겠다.
각 근원사건이 일어날 확률이 동일하지 않다면, 등확률 모델을 적용할 수가 없다.
겉으로 보기엔 경우의 수가 같아 보여도, 실제로는 각 경우가 얼마나 자주 일어나는지를 따져야 한다.
반드시, '각 근원사건이 발생할 확률이 동일한지' 를 판단한 이후에 등확률모델을 적용하도록 하자!