전확률 정리
n 개의 사건 {B1,B2,B3,...Bn} 가 각각 독립사건이고 P(B1)∪P(B2)∪P(B3)...∪P(Bn)=1 일때,
사건 A의 확률 P(A)=∑i=1nP(A,Bi)=∑i=1nP(A∣Bi)P(Bi)
베이즈 정리
사건 A를 조건으로 하는 임의의 사건 Bi의 조건부 확률
P(Bi∣A)=P(A)P(Bi∩A)=P(A)P(A∣Bi)P(Bi)
위 식에 전확률 정리 대입하면,
P(Bi∣A)=P(A)P(Bi∩A)=∑i=1nP(A∣Bi)P(Bi)P(A∣Bi)P(Bi)
베이즈 정리의 의미와 의의
- 새로운 정보를 토대로 어떤 사건이 발생했다는 주장에 대한 신뢰도를 갱신해 나가는 방법
- 이해가 어려운 이유 : 확률론에 대한 이해의 고정관념에서 비롯됨
- 빈도주의(frequentism): 확률에 대한 전통적인 관점으로 어떤 사건이 발생하는 빈도라는 개념으로 이해
- 100번 동전을 던졌을 때 50번 정도는 앞면이 나온다.
- 베이지안주의(Bayesianism): 어떤 주장에 대한 신뢰도, '확률'을 '주장에 대한 신뢰도'로 해석
-
Ex. 동전의 앞면이 나왔다는 주장의 신뢰도가 50%다.
P(H∣E)=P(E)P(E∣H)P(H)
H : Hypothesis(가설) ~ 어떤 사건이 발생했다는 주장
E : Evidence (새로운 정보)
-> P(H): 어떤 사건이 발생했다는 주장의 신뢰도, 즉 기존 정보를 바탕으로 한 신뢰도 및 확률 => 사전 확률
-> P(H∣E): 새로운 정보를 받은 후 갱신된 신뢰도, 즉 새로운 정보로 인해 업데이트 된 신뢰도 및 확률 => 사후 확률
-
베이즈 정리는 사전 확률과 사후 확률간의 관계에 대해 설명하는 정리
P(H∣E)=P(E)P(E∣H)P(H)
사전 확률이 있었고, 어떤 사건을 관찰한 뒤 내 불명확한 주장에 대해 사건을 토대로 신뢰도를 갱신하는 알고리즘이 어떻게 되는지 정리한 것
다시 말하면, 사전 확률은 불확실성이 존재. 그런데 E라는 사건, 근거를 가지고 어떻게 하면 신뢰도를 갱신할 수 있는지를 수학적으로 정리한 것.
- 경험에 기반한 선험적인, 혹은 불확실성을 내포하는 수치를 기반으로 함
- 추가되는 정보를 바탕으로 사전 확률을 갱신함
- 귀납적 추론 방법
- 추가 근거 확보를 통해 진리로 더 다가갈 수 있다는 철학을 내포
활용 예시)
코로나-19 독감의 발병률이 10% (=P(H))
- 실제로 코로나-19 독감이 걸렸을 때 검진할 확률 99% (= P(E∣H))
- 코로나-19 독감이 걸리지 않았는데 실제 걸리지 않았다고 검진할 확률이 98% (=P(Ec∣Hc))
만약 어떤 사람이 코로나에 걸렸다고 검진받았을 때,
이 사람이 실제로 걸렸을 확률은 얼마일까?
H: 실제 코로나가 걸린 사건의 신뢰도
E: 코로나가 있다고 진단 받은 새로운 정보
P(H)=0.1,P(E∣H)=0.99,P(Ec∣Hc)=0.98
만약 어떤 사람이 코로나에 걸렸다고 검진받았을 때,
이 사람이 실제로 걸렸을 확률 = P(H∣E)
P(H∣E)=P(E)P(E∣H)P(H)=P(E∣H)P(H)+P(E∣Hc)P(Hc)P(E∣H)P(H)=0.99∗0.1+0.02∗0.90.99∗0.1=0.846=84.6%
위의 결과를 바탕으로 사전확률이 갱신됨 99% -> 84.6%