베이즈 정리

Kiwoong Park·2022년 2월 10일
1

전확률 정리

n 개의 사건 {B1,B2,B3,...Bn}\{B_1, B_2, B_3, ... B_n\} 가 각각 독립사건이고 P(B1)P(B2)P(B3)...P(Bn)=1P(B_1)\cup P(B_2)\cup P(B_3)...\cup P(B_n)=1 일때,
사건 A의 확률 P(A)=i=1nP(A,Bi)=i=1nP(ABi)P(Bi)P(A) = \sum_{i=1}^nP(A,B_i)=\sum_{i=1}^nP(A|B_i)P(B_i)

베이즈 정리

사건 A를 조건으로 하는 임의의 사건 BiB_i의 조건부 확률

P(BiA)=P(BiA)P(A)=P(ABi)P(Bi)P(A)P(B_i|A) = \cfrac{P(B_i\cap A)}{P(A)} = \cfrac{P(A|B_i)P(Bi)}{P(A)}

위 식에 전확률 정리 대입하면,

P(BiA)=P(BiA)P(A)=P(ABi)P(Bi)i=1nP(ABi)P(Bi)P(B_i|A) = \cfrac{P(B_i\cap A)}{P(A)} = \cfrac{P(A|B_i)P(Bi)}{\sum_{i=1}^nP(A|B_i)P(B_i)}

베이즈 정리의 의미와 의의

  • 새로운 정보를 토대로 어떤 사건이 발생했다는 주장에 대한 신뢰도를 갱신해 나가는 방법
  • 이해가 어려운 이유 : 확률론에 대한 이해의 고정관념에서 비롯됨
    • 빈도주의(frequentism): 확률에 대한 전통적인 관점으로 어떤 사건이 발생하는 빈도라는 개념으로 이해
    • 100번 동전을 던졌을 때 50번 정도는 앞면이 나온다.
  • 베이지안주의(Bayesianism): 어떤 주장에 대한 신뢰도, '확률'을 '주장에 대한 신뢰도'로 해석
    • Ex. 동전의 앞면이 나왔다는 주장의 신뢰도가 50%다.

      P(HE)=P(EH)P(H)P(E)P(H|E) = \cfrac{P(E|H)P(H)}{P(E)}

      HH : Hypothesis(가설) ~ 어떤 사건이 발생했다는 주장
      EE : Evidence (새로운 정보)
      -> P(H)P(H): 어떤 사건이 발생했다는 주장의 신뢰도, 즉 기존 정보를 바탕으로 한 신뢰도 및 확률 => 사전 확률
      -> P(HE)P(H|E): 새로운 정보를 받은 후 갱신된 신뢰도, 즉 새로운 정보로 인해 업데이트 된 신뢰도 및 확률 => 사후 확률

    • 베이즈 정리는 사전 확률과 사후 확률간의 관계에 대해 설명하는 정리

      P(HE)=P(EH)P(H)P(E)P(H|E) = \cfrac{P(E|H)P(H)}{P(E)}

    사전 확률이 있었고, 어떤 사건을 관찰한 뒤 내 불명확한 주장에 대해 사건을 토대로 신뢰도를 갱신하는 알고리즘이 어떻게 되는지 정리한 것
    다시 말하면, 사전 확률은 불확실성이 존재. 그런데 E라는 사건, 근거를 가지고 어떻게 하면 신뢰도를 갱신할 수 있는지를 수학적으로 정리한 것.

  • 경험에 기반한 선험적인, 혹은 불확실성을 내포하는 수치를 기반으로 함
  • 추가되는 정보를 바탕으로 사전 확률을 갱신함
  • 귀납적 추론 방법
  • 추가 근거 확보를 통해 진리로 더 다가갈 수 있다는 철학을 내포

활용 예시)

코로나-19 독감의 발병률이 10% (=P(H)=P(H))

  • 실제로 코로나-19 독감이 걸렸을 때 검진할 확률 99% (= P(EH)P(E|H))
  • 코로나-19 독감이 걸리지 않았는데 실제 걸리지 않았다고 검진할 확률이 98% (=P(EcHc)P(E^c|H^c))

만약 어떤 사람이 코로나에 걸렸다고 검진받았을 때,
이 사람이 실제로 걸렸을 확률은 얼마일까?
HH: 실제 코로나가 걸린 사건의 신뢰도
EE: 코로나가 있다고 진단 받은 새로운 정보

P(H)=0.1,P(EH)=0.99,P(EcHc)=0.98P(H)=0.1, P(E|H)=0.99, P(E^c|H^c)=0.98

만약 어떤 사람이 코로나에 걸렸다고 검진받았을 때,
이 사람이 실제로 걸렸을 확률 = P(HE)P(H|E)

P(HE)=P(EH)P(H)P(E)=P(EH)P(H)P(EH)P(H)+P(EHc)P(Hc)=0.990.10.990.1+0.020.9=0.846=84.6%P(H|E) = \cfrac{P(E|H)P(H)}{P(E)}=\cfrac{P(E|H)P(H)}{P(E|H)P(H)+P(E|H^c)P(H^c)} \\ =\cfrac{0.99*0.1}{0.99*0.1+0.02*0.9} \\ = 0.846 = 84.6\%

위의 결과를 바탕으로 사전확률이 갱신됨 99% -> 84.6%

profile
You matter, never give up

0개의 댓글