조건부 확률(Conditional prbability)
한 사건이 일어났다는 전제 하에서 다른 사건이 일어날 확률
조건부 확률 공식
P(A∣B)=P(B)P(B∣A)P(A)
P(A) : 사전확률(prior)
사건 B가 발생하기 전에 가지고 있던 사건 A의 확률
P(A|B) : 사후확률(posterior)
사건 B가 발생한 후 갱신된 사건 A의 확률
P(B|A) : 가능도(likelihood)
사건 A가 발생한 경우 사건 B의 확률
P(B) : 증거(evidence)
확률의 크기 조정
베이즈 정리(Bayesian rule)
새로운 정보를 토대로 어떤 사건이 발생했다는 주장에 대한 신뢰도를 갱신해 나가는 방법
베이즈 정리 예제
어떤 희귀병을 진단하는 약물 A의 정확도는 99%이다.
이 희귀병에 걸릴확률은 전체 인구의 0.2%이다.
만약 이 진단약물이 양성이라고 판정했을 때, 실제 질병에 걸렸을 확률은 ?
P(user∣+)=P(+)P(+∣user)P(user)
=P(+∣user)P(user)+P(+∣NONuser)P(NONuser)P(+∣user)P(user)
0.99×0.002+0.01×0.9980.99×0.002
=0.198+0.9980.198
=0.1655......
즉, 오직 16.6% 정도 만이 양성 반응이 나왔다고 해도 실제로 질병에 걸렸을 확률이다.
만약 2번 3번 검사를 반복해서 양성이 나왔을 경우 확률은 높아지게 된다.
16.6%로 업데이트 하여 계산을 해보자.
P(User∣+)=0.99×0.166+0.01×0.8340.99×0.166
=0.16434+0.008340.16434
=0.9517......
2번째 결과도 양성이 나왔을 경우 95.2%로 확률이 갱신되었다.
다음과 같이 사전확률을 통해 갱신된 사후확률을 도출하는 것이 베이즈 정리이다.