Statistics - 확률(Probability) 1

nalimeitb·2026년 3월 21일

Statistics(HALF1007)

목록 보기
3/5

Statistics - 확률(Probability) 1

HALF1007 통계학(수학과 배윤한 교수님) 수업을 듣고 정리했습니다.


목차

  1. 확률에 관한 기본 용어
    • 확률실험 / 표본공간 / 사건 / 근원사건 / 공사건
    • 합사건 / 곱사건 / 여사건 / 배반사건 / 쌍마다 배반사건
  2. 확률에 대한 두 가지 관점
    • 도수 관점 vs 주관적 관점
  3. 수학적 확률 (등확률 모델)
  4. 통계적 확률 (경험적 확률)
    • 대수의 법칙
  5. 공리적 확률
    • 정의 및 필요조건
    • 성질과 증명
  6. 여러가지 확률 문제
    • 생일문제 / 가능성 트리 / 파스칼 문제 / 갈릴레오 문제

확률에 관한 기본 용어

확률실험 (random experiment)

확률실험이란, 결과를 미리 알 수 없지만 가능한 모든 결과는 예측 가능하고, 동일한 조건에서 반복 가능한 실험이다.

확률실험이 되기 위한 필요조건 세 가지:

  • 모든 결과를 예측 가능해야 한다.
  • 시행 전에는 결과를 알 수 없다.
  • 동일한 조건에서 반복이 가능해야 한다. (재현성)

예) 동전 던지기, 주사위 던지기 등


표본공간 (sample space)

표본공간이란, 확률실험에서 나타날 수 있는 모든 결과들의 집합이다.

  • 집합이므로 중복이 없다.
  • 복원 추출이냐, 비복원 추출이냐에 따라 표본공간이 달라질 수 있다.

예) 두 개의 주사위를 던지는 시행에서
S={(1,1), (1,2), , (6,6)}S = \{(1,1),\ (1,2),\ \cdots,\ (6,6)\} → 총 36개의 원소


사건 (event)

사건이란, 표본공간의 부분집합이다.

예) 동전 던지기 → S={,}S = \{앞, 뒤\}
주사위 던지기 → S={1,2,3,4,5,6}S = \{1, 2, 3, 4, 5, 6\}


근원사건 (elementary event / atomic event)

근원사건이란, 표본공간의 원소 단 하나로만 구성된 사건이다.

예1) 주사위 던지기 → {1}, {2}, {3}, {4}, {5}, {6}\{1\},\ \{2\},\ \{3\},\ \{4\},\ \{5\},\ \{6\}
예2) 동전 두 개 던지기 → {(,)}, {(,)}, {(,)}, {(,)}\{(앞,앞)\},\ \{(앞,뒤)\},\ \{(뒤,앞)\},\ \{(뒤,뒤)\}


공사건 (ϕ\phi)

공사건이란, 결코 일어나지 않는 사건, 즉 공집합이다.

예) 주사위를 던질 때 눈의 수가 7이 나오는 경우


합사건 (ABA \cup B)

ABA \cup BA 또는 B가 일어나는 사건, 즉 A와 B 중 적어도 하나가 발생하는 사건이다.

예) 주사위 던지기에서 소수의 눈 A={2,3,5}A = \{2, 3, 5\}, 홀수의 눈 B={1,3,5}B = \{1, 3, 5\} 라 할 때,
AB={1,2,3,5}A \cup B = \{1, 2, 3, 5\}


곱사건 (ABA \cap B)

ABA \cap BA와 B가 동시에 일어나는 사건이다.

예) 위와 동일하게 정의하면,
AB={3,5}A \cap B = \{3, 5\} (소수이면서 동시에 홀수)


여사건 (AcA^c)

여사건 AcA^c 는 사건 A에 속하지 않는 모든 결과를 포함하는 사건, 즉 A가 일어나지 않을 사건이다.

예) 주사위에서 홀수가 나오는 사건의 여사건 → {2,4,6}\{2, 4, 6\}


배반사건 (mutually exclusive / disjoint event)

배반사건이란, 두 사건의 교집합이 공집합인 경우다. 즉, 두 사건이 절대 동시에 일어날 수 없다.

AB=ϕA \cap B = \phi

예) A={1,3,5}A = \{1, 3, 5\}, B={2,4,6}B = \{2, 4, 6\} → A와 B는 배반사건


쌍마다 배반사건 (pairwisely-mutually exclusive events)

사건이 3개 이상 있을 때, 어떤 두 사건을 골라도 서로 배반인 경우를 쌍마다 배반사건이라 한다.

  • 수학적 표기

  • 쌍마다 배반사건 예시)

확률에 대한 두 가지 관점

확률이란, 하나의 사건이 일어날 수 있는 가능성을 수치로 나타낸 것이다.
사건 A가 일어날 확률을 P(A)P(A) 로 표기한다.

도수 관점 (frequency view) / 빈도 관점

  • 어떤 사건의 확률 = 전체 경우의 수에 대한 그 사건이 일어나는 경우의 수(빈도수)의 비
  • 관측된 빈도에 근거하므로 객관적으로 정의 가능하다.
  • 빈도주의자(frequentist)의 관점 — 통계학의 main stream

주관적 관점 (subjective view)

  • 사건에 대한 주관적 확신, 믿음의 정도로 확률을 정의한다.
  • 주관적임에도 실용적으로 유용한 경우가 많다.
  • 베이즈주의자(Bayesian)의 관점 — AI, ML, DL 분야에서 강력하게 활용되며 main stream을 넘보는 중

수학적 확률(등확률 모델)

수학적 확률이란, 표본공간의 각 근원사건이 일어날 가능성이 모두 동등할 때 적용하는 확률 모형이다.

정의

  • N개의 결과로 구성된 표본공간 S={e1,e2,,eN}S = \{e_1, e_2, \cdots, e_N\} 에서, 각 결과가 일어날 가능성이 동일하고 사건 A가 발생하는 결과가 m개일 때, P(A)=mNP(A) = \frac{m}{N} 로 정의한다.

  • 수학적 확률 모형의 필요조건과 예시

성질

  • 0P(A)10 \leq P(A) \leq 1
  • 전사건에 대하여 P(S)=1P(S) = 1
  • 두 사건 A, B에 대하여 P(AB)=P(A)+P(B)P(AB)P(A \cup B) = P(A) + P(B) - P(A \cap B)
  • A, B가 배반사건이면 P(AB)=P(A)+P(B)P(A \cup B) = P(A) + P(B)

수학적 확률(등확률 모델)은 근원사건이 일어날 가능성이 동일하다는 가정과, 표본공간의 원소 수가 유한 개일 때에만 정의된다. 이 조건을 만족하지 않는 경우에는 섣불리 적용해서는 안 된다.


통계적 확률(경험적 확률)

통계적 확률이란, 동일한 확률실험을 N번 반복할 때 사건 A가 발생한 횟수를 m이라 하면,
P(A)=m/NP(A) = m/N 으로 정의하는 경험에 근거한 확률이다.

  • 각자의 경험에 따라 확률 값이 달라질 수 있다.
  • Consensus를 이루기 위해서는 N수를 무한히 늘려야 할수도..
  • 통계적 확률에서도 확률의 덧셈정리는 여전히 성립한다.

수학적 확률 vs 통계적 확률

수학적 확률통계적 확률
기반등확률 가정실제 실험 결과
예시공정한 동전: P()=1/2P(앞) = 1/2100번 던져 45번 앞면: P=45/100P = 45/100
한계등확률 가정, 유한 표본공간 필요매번 다를 수 있고, 무한 시행의 극한으로 정의

대수의 법칙 (Law of Large Numbers)

사건 A가 일어날 확률을 P라 할 때, 시행 횟수 N이 커질수록 상대도수 m/N은 P에 수렴한다.

공정한 동전을 던지는 실험에서 앞면이 나오는 상대도수를 관찰하면, 처음에는 불안정하지만 시행 횟수가 늘어날수록 1/21/2 에 점점 가까워지는 것을 확인할 수 있다.


공리적 확률

만약 동전이 공정하지 않다면?
수학적 확률 모형에서는 각 사건의 확률을 어떻게 정의해야 할까?

공리적 확률 모형은 "확률을 수학의 반열에 올려보려는 시도" 로,
다음 세 가지 공리(axiom)만 만족하면 확률로 인정하겠다는 모형이다.

공리적 확률의 정의(필요조건)

(1) S의 부분집합 A에 대하여: 0P(A)10 \leq P(A) \leq 1

(2) 표본공간 S에 대하여: P(S)=1P(S) = 1

(3) 가법성(additivity): 쌍마다 배반인 사건 A1,A2,A_1, A_2, \cdots 에 대하여,

P(i=1nAi)=i=1nP(Ai)P\left(\bigcup_{i=1}^{n} A_i\right) = \sum_{i=1}^{n} P(A_i)

가법성(additivity)

  • 가법성은 확률이 비로소 측도(measure)임을 의미한다.
  • n개의 합사건이 각 사건의 확률의 합과 같다는 것을 의미한다.

공리적 확률의 성질과 증명

(1) P(ϕ)=0P(\phi) = 0

S=SϕS = S \cup \phi 이고, 둘은 배반이므로 가법성에 의해, P(S)=P(S)+P(ϕ)P(S) = P(S) + P(\phi)
 P(ϕ)=0\therefore\ P(\phi) = 0

(2) P(Ac)=1P(A)P(A^c) = 1 - P(A)

S=AAcS = A \cup A^c 이고, 둘은 배반이므로, P(S)=P(A)+P(Ac)=1P(S) = P(A) + P(A^c) = 1
 P(Ac)=1P(A)\therefore\ P(A^c) = 1 - P(A)


(3) ABA \subset B 이면, P(A)P(B)P(A) \leq P(B)

B=A(BAc)B = A \cup (B \cap A^c) 이고, 둘은 배반이므로,
P(B)=P(A)+P(BAc)P(A)P(B) = P(A) + P(B \cap A^c) \geq P(A)
(P(BAc)0)(\because P(B \cap A^c) \geq 0)


(4) 임의의 두 사건 A, B에 대하여 (덧셈정리)

P(AB)=P(A)+P(B)P(AB)P(A \cup B) = P(A) + P(B) - P(A \cap B)

AB=A(BAc)A \cup B = A \cup (B \cap A^c) (배반)로 나누면, P(AB)=P(A)+P(BAc)P(A \cup B) = P(A) + P(B \cap A^c)
B=(AB)(BAc)B = (A \cap B) \cup (B \cap A^c) (배반)이므로, P(B)=P(AB)+P(BAc)P(B) = P(A \cap B) + P(B \cap A^c)

따라서, 두 식을 정리하면 위의 결과를 얻는다.


(5) P(AB)P(A)+P(B)P(A \cup B) \leq P(A) + P(B)

  • 성질 3과 성질4에 따라서, 교집합의 확률 P(AB)0P(A \cap B) \ge 0 이므로,
    성질 3의 증명과 같은 방식으로 증명가능하다.

(6) 포함-배제 원리 (Inclusion-Exclusion Principle)

P(ABC)=P(A)+P(B)+P(C)P(AB)P(BC)P(AC)+P(ABC)P(A \cup B \cup C) = P(A) + P(B) + P(C) - P(A \cap B) - P(B \cap C) - P(A \cap C) + P(A \cap B \cap C)
  • 포함-배제 원리란, 전체의 확률을 구할 때 일단 다 더하고(포함), 겹치는 부분을 빼는(배제) 과정을 반복해서 정확한 값을 구하는 방법이다. 성질 (4)와 (6)이 이에 해당한다.
  • 핵심은 집합을 배반인 사건들로 잘 나누는 것
  • (AB)(A \cup B)DD로 놓으면 성질 (4)의 증명과 동일한 방식으로 유도된다.

공리적 확률 예시

Q) 세 명의 아이가 있는 가정에서 성별에 대해 두 가지 표본공간이 제시되었다. (B: 소년, G: 소녀)

S1={BBB, BBG, BGB, GBB, BGG, GBG, GGB, GGG}S_1 = \{BBB,\ BBG,\ BGB,\ GBB,\ BGG,\ GBG,\ GGB,\ GGG\}
S2={0B, 1B, 2B, 3B}S_2 = \{0B,\ 1B,\ 2B,\ 3B\}

S1S_1은 출생 순서에 의해, S2S_2는 소년의 수에 의해 정의된 표본공간이다.
두 개의 표본공간이 어떻게 다른지 설명하시오.

  • 동일한 확률공간에 대해 여러 개의 표본공간이 정의될 수 있다.
  • S1S_1은 각 근원사건의 확률이 1/81/8로 동일 → 등확률 모델 적용 가능
  • S2S_2는 각 근원사건의 확률이 다름 (예: 0B의 확률 = 1/8, 1B의 확률 = 3/8) → 등확률 모델 적용 불가

여러가지 확률 문제

수학적 확률을 바로 적용할 수 있는지, 즉 등확률 가정이 성립하는지에 집중해서 보자.


생일문제 (Birthday Paradox)

Q1) n명의 사람이 한 교실에 모여 있을 때, 그 중 생일이 같은 두 명 이상이 존재할 확률 P(n)P(n)은?

여사건을 이용해서 구하는 것이 편하다.

P(n)=1P(모두 다른 생일)=1365×364××(365n+1)365nP(n) = 1 - P(\text{모두 다른 생일}) = 1 - \frac{365 \times 364 \times \cdots \times (365 - n + 1)}{365^n}

직관과 달리, n=23n = 23 이면 P(n)>0.5P(n) > 0.5 를 넘어선다. 생각보다 훨씬 빨리 확률이 올라간다.


가능성 트리 (Possibility Tree)

Q2) A, B 두 팀 중 어느 한 팀이 연속 2회 이기거나 또는 총 3회 이기면 승리한다.
(이길 확률은 50%라고 가정한다.)

(1) 가능한 토너먼트 진행 방법은 몇 가지인가?

가능성 트리를 그리면 총 10가지 경우가 존재한다.

(2) 5게임이 필요할 확률은?

5게임으로 끝나는 경우는 4가지이다.

잘못된 풀이) 4/104/10 → 각 경우가 동일한 확률을 갖는다는 가정은 틀렸다.
2게임 만에 끝나는 경우와 5게임에 끝나는 경우의 확률은 다를 수 밖에 없다.

올바른 풀이) 각 게임은 독립이고 확률이 1/21/2 이므로,

P(5게임 필요)=4×(12)5=432=18P(\text{5게임 필요}) = 4 \times \left(\frac{1}{2}\right)^5 = \frac{4}{32} = \frac{1}{8}

수학적 확률(등확률 모델)을 적용할 때는 각 경우의 수가 동일한 확률을 갖는지 반드시 확인해야 한다.


메레가 파스칼에게 낸 문제 (도박사 파스칼 문제)

Q3) 상금은 64만원. 3번을 먼저 이기는 사람이 상금을 가져가기로 했는데,
메레가 2번, 상대방이 1번 이긴 상황에서 게임이 중단되었다.
상금을 어떻게 나누어야 하는가?

두 사람이 합의한 조건: 이길 수 있는 가능성의 정도에 따라 상금을 나눈다.

상대방의 주장

메레가 2/3을 가져가고, 자신이 1/3을 가져가야 한다.

이미 이긴 횟수만 반영하고 미래의 가능성을 전혀 고려하지 않은 것이다.
만약 100번을 먼저 이기는 조건이라면 이 주장은 더욱 말이 안 된다.

파스칼의 주장

다음 시합에서 메레가 이기든 지든, 메레는 최소 32만원을 확보한 셈이다.
이후의 나머지 32만원을 각각 50%로 나누면, 메레는 32+16=4832 + 16 = 48만원을 받아야 한다.

  • 메레가 다음 시합에서 이길 경우: 64만원 (게임 종료)
  • 메레가 다음 시합에서 질 경우: 이후 Q3의 상황이 되어 메레가 가져갈 기댓값은 32만원

→ 최소 32만원은 보장, 나머지 32만원은 반반 → 메레 32+16=4832 + 16 = 48만원

페르마의 주장

이후 남은 시합의 경우를 모두 열거하면:
1. 메레 승 (O) → 확률 1/21/2
2. 메레 패, 메레 승 (XO) → 확률 1/41/4
3. 메레 패, 메레 패 (XX) → 확률 1/41/4

메레가 이기는 경우는 ①, ②이므로:

P(메레 최종 우승)=12+14=34P(\text{메레 최종 우승}) = \frac{1}{2} + \frac{1}{4} = \frac{3}{4}

메레 몫=64×34=48만원\therefore \text{메레 몫} = 64 \times \frac{3}{4} = 48\text{만원}


Q4) 위 조건에서 메레가 2번, 상대방이 0번 이긴 상태에서 게임이 중단되었다.
상금을 어떻게 나누어야 하는가?

파스칼의 주장

이후 남은 시합의 경우를 모두 열거하면, 메레가 이길 확률 = 7/87/8, 상대방이 이길 확률 = 1/81/8 (세 판을 모두 이겨야 하므로).

메레 몫=64×78=56만원\therefore \text{메레 몫} = 64 \times \frac{7}{8} = \mathbf{56}\text{만원}

페르마의 주장

  • 다음 시합에서 메레가 이기면 → 게임 종료, 64만원 (확률 1/2)
  • 다음 시합에서 메레가 지면 → Q3의 상황(메레 2승 상대 1승)이 되므로, 메레의 기댓값 = 48만원 (확률 1/2)

E=12×64+12×48=32+24=56만원E = \frac{1}{2} \times 64 + \frac{1}{2} \times 48 = 32 + 24 = \mathbf{56}\text{만원}


갈릴레오가 도박사 친구로부터 받은 질문

Q5) 3개의 주사위를 동시에 던졌을 때, 눈의 합이 9가 되는 경우10이 되는 경우의 조합 수는 각각 6가지로 같다. 그런데 실제로는 합이 10이 될 확률이 더 큰 이유는 무엇인가?

(1) 눈의 합 = 9: (1,2,6), (1,3,5), (1,4,4), (2,2,5), (2,3,4), (3,3,3)(1,2,6),\ (1,3,5),\ (1,4,4),\ (2,2,5),\ (2,3,4),\ (3,3,3)

(2) 눈의 합 = 10: (1,3,6), (1,4,5), (2,2,6), (2,3,5), (2,4,4), (3,3,4)(1,3,6),\ (1,4,5),\ (2,2,6),\ (2,3,5),\ (2,4,4),\ (3,3,4)

조합은 6가지로 같지만, 각 조합이 실제로 나타나는 근원사건의 수(순서 고려) 가 다르다. 예를 들어 (1,2,6)(1,2,6)은 배열 방법이 3!=63! = 6가지지만, (3,3,3)(3,3,3)11가지뿐이다.

총 근원사건 수 (순서 고려)확률
96+6+3+3+6+1=256+6+3+3+6+1 = \mathbf{25}25/21625/216
106+6+3+6+3+3=276+6+3+6+3+3 = \mathbf{27}27/21627/216

P(=10)>P(=9)\therefore P(\text{합}=10) > P(\text{합}=9)

이번 블로그에서 가장 많이 언급한 내용이지만, 마지막으로 또 한번 강조하겠다.
각 근원사건이 일어날 확률이 동일하지 않다면, 등확률 모델을 적용할 수가 없다.
겉으로 보기엔 경우의 수가 같아 보여도, 실제로는 각 경우가 얼마나 자주 일어나는지를 따져야 한다.
반드시, '각 근원사건이 발생할 확률이 동일한지' 를 판단한 이후에 등확률모델을 적용하도록 하자!

0개의 댓글