Statistics - 확률(Probability) 1

nalimeitb·2026년 3월 21일

Statistics(HALF1007)

목록 보기

3/5

Statistics - 확률(Probability) 1

HALF1007 통계학(수학과 배윤한 교수님) 수업을 듣고 정리했습니다.

확률에 관한 기본 용어
- 확률실험 / 표본공간 / 사건 / 근원사건 / 공사건
- 합사건 / 곱사건 / 여사건 / 배반사건 / 쌍마다 배반사건
확률에 대한 두 가지 관점
- 도수 관점 vs 주관적 관점
수학적 확률 (등확률 모델)
통계적 확률 (경험적 확률)
- 대수의 법칙
공리적 확률
- 정의 및 필요조건
- 성질과 증명
여러가지 확률 문제
- 생일문제 / 가능성 트리 / 파스칼 문제 / 갈릴레오 문제

확률에 관한 기본 용어

확률실험 (random experiment)

확률실험이란, 결과를 미리 알 수 없지만 가능한 모든 결과는 예측 가능하고, 동일한 조건에서 반복 가능한 실험이다.

확률실험이 되기 위한 필요조건 세 가지:

모든 결과를 예측 가능해야 한다.
시행 전에는 결과를 알 수 없다.
동일한 조건에서 반복이 가능해야 한다. (재현성)

예) 동전 던지기, 주사위 던지기 등

표본공간 (sample space)

표본공간이란, 확률실험에서 나타날 수 있는 모든 결과들의 집합이다.

집합이므로 중복이 없다.
복원 추출이냐, 비복원 추출이냐에 따라 표본공간이 달라질 수 있다.

예) 두 개의 주사위를 던지는 시행에서
$S = \{(1,1),\ (1,2),\ \cdots,\ (6,6)\}$ → 총 36개의 원소

사건 (event)

사건이란, 표본공간의 부분집합이다.

예) 동전 던지기 → $S = \{앞, 뒤\}$
주사위 던지기 → $S = \{1, 2, 3, 4, 5, 6\}$

근원사건 (elementary event / atomic event)

근원사건이란, 표본공간의 원소 단 하나로만 구성된 사건이다.

예1) 주사위 던지기 → $\{1\},\ \{2\},\ \{3\},\ \{4\},\ \{5\},\ \{6\}$
예2) 동전 두 개 던지기 → $\{(앞,앞)\},\ \{(앞,뒤)\},\ \{(뒤,앞)\},\ \{(뒤,뒤)\}$

공사건 ( $\phi$ )

공사건이란, 결코 일어나지 않는 사건, 즉 공집합이다.

예) 주사위를 던질 때 눈의 수가 7이 나오는 경우

합사건 ( $A \cup B$ )

$A \cup B$ 는 A 또는 B가 일어나는 사건, 즉 A와 B 중 적어도 하나가 발생하는 사건이다.

예) 주사위 던지기에서 소수의 눈 $A = \{2, 3, 5\}$ , 홀수의 눈 $B = \{1, 3, 5\}$ 라 할 때,
$A \cup B = \{1, 2, 3, 5\}$

곱사건 ( $A \cap B$ )

$A \cap B$ 는 A와 B가 동시에 일어나는 사건이다.

예) 위와 동일하게 정의하면,
$A \cap B = \{3, 5\}$ (소수이면서 동시에 홀수)

여사건 ( $A^c$ )

여사건 $A^c$ 는 사건 A에 속하지 않는 모든 결과를 포함하는 사건, 즉 A가 일어나지 않을 사건이다.

예) 주사위에서 홀수가 나오는 사건의 여사건 → $\{2, 4, 6\}$

배반사건 (mutually exclusive / disjoint event)

배반사건이란, 두 사건의 교집합이 공집합인 경우다. 즉, 두 사건이 절대 동시에 일어날 수 없다.

$A \cap B = \phi$

예) $A = \{1, 3, 5\}$ , $B = \{2, 4, 6\}$ → A와 B는 배반사건

쌍마다 배반사건 (pairwisely-mutually exclusive events)

사건이 3개 이상 있을 때, 어떤 두 사건을 골라도 서로 배반인 경우를 쌍마다 배반사건이라 한다.

수학적 표기
쌍마다 배반사건 예시)

확률에 대한 두 가지 관점

확률이란, 하나의 사건이 일어날 수 있는 가능성을 수치로 나타낸 것이다.
사건 A가 일어날 확률을 $P(A)$ 로 표기한다.

도수 관점 (frequency view) / 빈도 관점

어떤 사건의 확률 = 전체 경우의 수에 대한 그 사건이 일어나는 경우의 수(빈도수)의 비
관측된 빈도에 근거하므로 객관적으로 정의 가능하다.
빈도주의자(frequentist)의 관점 — 통계학의 main stream

주관적 관점 (subjective view)

사건에 대한 주관적 확신, 믿음의 정도로 확률을 정의한다.
주관적임에도 실용적으로 유용한 경우가 많다.
베이즈주의자(Bayesian)의 관점 — AI, ML, DL 분야에서 강력하게 활용되며 main stream을 넘보는 중

수학적 확률(등확률 모델)

수학적 확률이란, 표본공간의 각 근원사건이 일어날 가능성이 모두 동등할 때 적용하는 확률 모형이다.

정의

N개의 결과로 구성된 표본공간 $S = \{e_1, e_2, \cdots, e_N\}$ 에서, 각 결과가 일어날 가능성이 동일하고 사건 A가 발생하는 결과가 m개일 때, $P(A) = \frac{m}{N}$ 로 정의한다.

수학적 확률 모형의 필요조건과 예시

성질

$0 \leq P(A) \leq 1$
전사건에 대하여 $P(S) = 1$
두 사건 A, B에 대하여 $P(A \cup B) = P(A) + P(B) - P(A \cap B)$
A, B가 배반사건이면 $P(A \cup B) = P(A) + P(B)$

수학적 확률(등확률 모델)은 근원사건이 일어날 가능성이 동일하다는 가정과, 표본공간의 원소 수가 유한 개일 때에만 정의된다. 이 조건을 만족하지 않는 경우에는 섣불리 적용해서는 안 된다.

통계적 확률(경험적 확률)

통계적 확률이란, 동일한 확률실험을 N번 반복할 때 사건 A가 발생한 횟수를 m이라 하면,
$P(A) = m/N$ 으로 정의하는 경험에 근거한 확률이다.

각자의 경험에 따라 확률 값이 달라질 수 있다.
Consensus를 이루기 위해서는 N수를 무한히 늘려야 할수도..
통계적 확률에서도 확률의 덧셈정리는 여전히 성립한다.

수학적 확률 vs 통계적 확률

	수학적 확률	통계적 확률
기반	등확률 가정	실제 실험 결과
예시	공정한 동전: $P(앞) = 1/2$	100번 던져 45번 앞면: $P = 45/100$
한계	등확률 가정, 유한 표본공간 필요	매번 다를 수 있고, 무한 시행의 극한으로 정의

대수의 법칙 (Law of Large Numbers)

사건 A가 일어날 확률을 P라 할 때, 시행 횟수 N이 커질수록 상대도수 m/N은 P에 수렴한다.

공정한 동전을 던지는 실험에서 앞면이 나오는 상대도수를 관찰하면, 처음에는 불안정하지만 시행 횟수가 늘어날수록 $1/2$ 에 점점 가까워지는 것을 확인할 수 있다.

공리적 확률

만약 동전이 공정하지 않다면?
수학적 확률 모형에서는 각 사건의 확률을 어떻게 정의해야 할까?

공리적 확률 모형은 "확률을 수학의 반열에 올려보려는 시도" 로,
다음 세 가지 공리(axiom)만 만족하면 확률로 인정하겠다는 모형이다.

공리적 확률의 정의(필요조건)

(1) S의 부분집합 A에 대하여: $0 \leq P(A) \leq 1$

(2) 표본공간 S에 대하여: $P(S) = 1$

(3) 가법성(additivity): 쌍마다 배반인 사건 $A_1, A_2, \cdots$ 에 대하여,

$P\left(\bigcup_{i=1}^{n} A_i\right) = \sum_{i=1}^{n} P(A_i)$

가법성(additivity)

가법성은 확률이 비로소 측도(measure)임을 의미한다.

n개의 합사건이 각 사건의 확률의 합과 같다는 것을 의미한다.

공리적 확률의 성질과 증명

(1) $P(\phi) = 0$

$S = S \cup \phi$ 이고, 둘은 배반이므로 가법성에 의해, $P(S) = P(S) + P(\phi)$
$\therefore\ P(\phi) = 0$

(2) $P(A^c) = 1 - P(A)$

$S = A \cup A^c$ 이고, 둘은 배반이므로, $P(S) = P(A) + P(A^c) = 1$
$\therefore\ P(A^c) = 1 - P(A)$

(3) $A \subset B$ 이면, $P(A) \leq P(B)$

$B = A \cup (B \cap A^c)$ 이고, 둘은 배반이므로,
$P(B) = P(A) + P(B \cap A^c) \geq P(A)$
$(\because P(B \cap A^c) \geq 0)$

(4) 임의의 두 사건 A, B에 대하여 (덧셈정리)

$P(A \cup B) = P(A) + P(B) - P(A \cap B)$

$A \cup B = A \cup (B \cap A^c)$ (배반)로 나누면, $P(A \cup B) = P(A) + P(B \cap A^c)$
$B = (A \cap B) \cup (B \cap A^c)$ (배반)이므로, $P(B) = P(A \cap B) + P(B \cap A^c)$

따라서, 두 식을 정리하면 위의 결과를 얻는다.

(5) $P(A \cup B) \leq P(A) + P(B)$

성질 3과 성질4에 따라서, 교집합의 확률 $P(A \cap B) \ge 0$ 이므로,
성질 3의 증명과 같은 방식으로 증명가능하다.

(6) 포함-배제 원리 (Inclusion-Exclusion Principle)

P(A \cup B \cup C) = P(A) + P(B) + P(C) - P(A \cap B) - P(B \cap C) - P(A \cap C) + P(A \cap B \cap C)

포함-배제 원리란, 전체의 확률을 구할 때 일단 다 더하고(포함), 겹치는 부분을 빼는(배제) 과정을 반복해서 정확한 값을 구하는 방법이다. 성질 (4)와 (6)이 이에 해당한다.
핵심은 집합을 배반인 사건들로 잘 나누는 것
$(A \cup B)$ 를 $D$ 로 놓으면 성질 (4)의 증명과 동일한 방식으로 유도된다.

공리적 확률 예시

Q) 세 명의 아이가 있는 가정에서 성별에 대해 두 가지 표본공간이 제시되었다. (B: 소년, G: 소녀)

$S_1 = \{BBB,\ BBG,\ BGB,\ GBB,\ BGG,\ GBG,\ GGB,\ GGG\}$
$S_2 = \{0B,\ 1B,\ 2B,\ 3B\}$

$S_1$ 은 출생 순서에 의해, $S_2$ 는 소년의 수에 의해 정의된 표본공간이다.
두 개의 표본공간이 어떻게 다른지 설명하시오.

동일한 확률공간에 대해 여러 개의 표본공간이 정의될 수 있다.
$S_1$ 은 각 근원사건의 확률이 $1/8$ 로 동일 → 등확률 모델 적용 가능
$S_2$ 는 각 근원사건의 확률이 다름 (예: 0B의 확률 = 1/8, 1B의 확률 = 3/8) → 등확률 모델 적용 불가

여러가지 확률 문제

수학적 확률을 바로 적용할 수 있는지, 즉 등확률 가정이 성립하는지에 집중해서 보자.

생일문제 (Birthday Paradox)

Q1) n명의 사람이 한 교실에 모여 있을 때, 그 중 생일이 같은 두 명 이상이 존재할 확률 $P(n)$ 은?

여사건을 이용해서 구하는 것이 편하다.

$P(n) = 1 - P(\text{모두 다른 생일}) = 1 - \frac{365 \times 364 \times \cdots \times (365 - n + 1)}{365^n}$

직관과 달리, $n = 23$ 이면 $P(n) > 0.5$ 를 넘어선다. 생각보다 훨씬 빨리 확률이 올라간다.

가능성 트리 (Possibility Tree)

Q2) A, B 두 팀 중 어느 한 팀이 연속 2회 이기거나 또는 총 3회 이기면 승리한다.
(이길 확률은 50%라고 가정한다.)

(1) 가능한 토너먼트 진행 방법은 몇 가지인가?

가능성 트리를 그리면 총 10가지 경우가 존재한다.

(2) 5게임이 필요할 확률은?

5게임으로 끝나는 경우는 4가지이다.

잘못된 풀이) $4/10$ → 각 경우가 동일한 확률을 갖는다는 가정은 틀렸다.
2게임 만에 끝나는 경우와 5게임에 끝나는 경우의 확률은 다를 수 밖에 없다.

올바른 풀이) 각 게임은 독립이고 확률이 $1/2$ 이므로,

$P(\text{5게임 필요}) = 4 \times \left(\frac{1}{2}\right)^5 = \frac{4}{32} = \frac{1}{8}$

수학적 확률(등확률 모델)을 적용할 때는 각 경우의 수가 동일한 확률을 갖는지 반드시 확인해야 한다.

메레가 파스칼에게 낸 문제 (도박사 파스칼 문제)

Q3) 상금은 64만원. 3번을 먼저 이기는 사람이 상금을 가져가기로 했는데,
메레가 2번, 상대방이 1번 이긴 상황에서 게임이 중단되었다.
상금을 어떻게 나누어야 하는가?

두 사람이 합의한 조건: 이길 수 있는 가능성의 정도에 따라 상금을 나눈다.

상대방의 주장

메레가 2/3을 가져가고, 자신이 1/3을 가져가야 한다.

이미 이긴 횟수만 반영하고 미래의 가능성을 전혀 고려하지 않은 것이다.
만약 100번을 먼저 이기는 조건이라면 이 주장은 더욱 말이 안 된다.

파스칼의 주장

다음 시합에서 메레가 이기든 지든, 메레는 최소 32만원을 확보한 셈이다.
이후의 나머지 32만원을 각각 50%로 나누면, 메레는 $32 + 16 = 48$ 만원을 받아야 한다.

메레가 다음 시합에서 이길 경우: 64만원 (게임 종료)
메레가 다음 시합에서 질 경우: 이후 Q3의 상황이 되어 메레가 가져갈 기댓값은 32만원

→ 최소 32만원은 보장, 나머지 32만원은 반반 → 메레 $32 + 16 = 48$ 만원

페르마의 주장

이후 남은 시합의 경우를 모두 열거하면:
1. 메레 승 (O) → 확률 $1/2$
2. 메레 패, 메레 승 (XO) → 확률 $1/4$
3. 메레 패, 메레 패 (XX) → 확률 $1/4$

메레가 이기는 경우는 ①, ②이므로:

$P(\text{메레 최종 우승}) = \frac{1}{2} + \frac{1}{4} = \frac{3}{4}$

$\therefore \text{메레 몫} = 64 \times \frac{3}{4} = 48\text{만원}$

Q4) 위 조건에서 메레가 2번, 상대방이 0번 이긴 상태에서 게임이 중단되었다.
상금을 어떻게 나누어야 하는가?

파스칼의 주장

이후 남은 시합의 경우를 모두 열거하면, 메레가 이길 확률 = $7/8$ , 상대방이 이길 확률 = $1/8$ (세 판을 모두 이겨야 하므로).

$\therefore \text{메레 몫} = 64 \times \frac{7}{8} = \mathbf{56}\text{만원}$

페르마의 주장

다음 시합에서 메레가 이기면 → 게임 종료, 64만원 (확률 1/2)
다음 시합에서 메레가 지면 → Q3의 상황(메레 2승 상대 1승)이 되므로, 메레의 기댓값 = 48만원 (확률 1/2)

$E = \frac{1}{2} \times 64 + \frac{1}{2} \times 48 = 32 + 24 = \mathbf{56}\text{만원}$

갈릴레오가 도박사 친구로부터 받은 질문

Q5) 3개의 주사위를 동시에 던졌을 때, 눈의 합이 9가 되는 경우와 10이 되는 경우의 조합 수는 각각 6가지로 같다. 그런데 실제로는 합이 10이 될 확률이 더 큰 이유는 무엇인가?

(1) 눈의 합 = 9: $(1,2,6),\ (1,3,5),\ (1,4,4),\ (2,2,5),\ (2,3,4),\ (3,3,3)$

(2) 눈의 합 = 10: $(1,3,6),\ (1,4,5),\ (2,2,6),\ (2,3,5),\ (2,4,4),\ (3,3,4)$

조합은 6가지로 같지만, 각 조합이 실제로 나타나는 근원사건의 수(순서 고려) 가 다르다. 예를 들어 $(1,2,6)$ 은 배열 방법이 $3! = 6$ 가지지만, $(3,3,3)$ 은 $1$ 가지뿐이다.

합	총 근원사건 수 (순서 고려)	확률
9	$6+6+3+3+6+1 = \mathbf{25}$	$25/216$
10	$6+6+3+6+3+3 = \mathbf{27}$	$27/216$

$\therefore P(\text{합}=10) > P(\text{합}=9)$

이번 블로그에서 가장 많이 언급한 내용이지만, 마지막으로 또 한번 강조하겠다.
각 근원사건이 일어날 확률이 동일하지 않다면, 등확률 모델을 적용할 수가 없다.
겉으로 보기엔 경우의 수가 같아 보여도, 실제로는 각 경우가 얼마나 자주 일어나는지를 따져야 한다.
반드시, '각 근원사건이 발생할 확률이 동일한지' 를 판단한 이후에 등확률모델을 적용하도록 하자!

nalimeitb

이전 포스트

Statistics - 기술통계학(Descriptive Statistics) 2

다음 포스트

Statistics - 확률(Probability) 1

Statistics(HALF1007)

Statistics - 확률(Probability) 1

목차

확률에 관한 기본 용어

확률실험 (random experiment)

표본공간 (sample space)

사건 (event)

근원사건 (elementary event / atomic event)

공사건 (ϕ\phiϕ)

합사건 (A∪BA \cup BA∪B)

곱사건 (A∩BA \cap BA∩B)

여사건 (AcA^cAc)

배반사건 (mutually exclusive / disjoint event)

쌍마다 배반사건 (pairwisely-mutually exclusive events)

확률에 대한 두 가지 관점

도수 관점 (frequency view) / 빈도 관점

주관적 관점 (subjective view)

수학적 확률(등확률 모델)

정의

성질

통계적 확률(경험적 확률)

수학적 확률 vs 통계적 확률

대수의 법칙 (Law of Large Numbers)

공리적 확률

공리적 확률의 정의(필요조건)

가법성(additivity)

공리적 확률의 성질과 증명

공리적 확률 예시

여러가지 확률 문제

생일문제 (Birthday Paradox)

가능성 트리 (Possibility Tree)

메레가 파스칼에게 낸 문제 (도박사 파스칼 문제)

상대방의 주장

파스칼의 주장

페르마의 주장

파스칼의 주장

페르마의 주장

갈릴레오가 도박사 친구로부터 받은 질문

Statistics - 기술통계학(Descriptive Statistics) 2

Statistics - 확률(Probability) 2

0개의 댓글

공사건 ( $\phi$ )

합사건 ( $A \cup B$ )

곱사건 ( $A \cap B$ )

여사건 ( $A^c$ )