Bayes' Theorom가 주는 의미

Cramming An·2023년 3월 28일

Machine Learning

목록 보기

1/2

통계를 비롯해 머신러닝에 관심이 있으신 분들은 한번 쯤 들어보셨을 만한 Bayes' Theorom 에 대해 이야기 해보려 합니다.

사실 Bayes' Theorom 의 수학적인 형태는 간단합니다.

아마 고등학교 당시 배웠던 조건부 확률 을 떠올리시면 수식자체의 적확성에 대해서는 의심의 여지가 없어 보입니다.

하지만 이번 시간에는 수학적인 증명 대신, 이 짧은 수식이 함축하고 있는 진정한 의미에 대해서 알아보고, 현실 세계에서의 예시에 대해 생각해보려 합니다.

우리는 언제나 미래를 예측하고자 합니다. 그리고, 꽤 많은 경우 경험을 통해 미래를 예측하는데 성공합니다.

하지만, 애석하게도 많은 경우 관측하기 어려운 경우를 궁금해합니다.

이 상황에서 소위 Unobservable 경우가 일어날 확률을 알기 위해선 Unobservable 이 원인이 되는 어떤 단서 찾아야 합니다. (마치 알 수 없는 범인을 잡기 위한 증거 수집처럼)

이 때, 우리가 알고 싶은 Unobservable 를 "Belief"
그리고, 단서를 "Evidence"
라고 합니다.

이제 우리가 알고 싶은 "Belief" 를 어떻게 "Evidence" 를 통해 적절하게 예측할 수 있는지 알아봅시다.

우리가 알고 싶은 "Belief" 적절하게 구한다는 의미는, 부정확할 수 있는 "Belief" 에 대한 확률을 정확한 "Evidence" 로 update 한다는 의미와 같습니다.

예를 들어, 대한민국에 사는 리차드라는 친구가 오늘 코로나에 걸렸을 확률에 대해 알아봅시다.

우리는 "Belief" 를 다음과 같이 간단히 구할 수 있습니다.
하지만, 이것이 과연 적절할까요?

증거를 모아봅시다. 리차드 는 기침을 했다고 합니다.

이제 리차드 가 오늘 코로나에 걸렸을 확률를 update 해봅시다.

Bayes' Theorom 는 위 과정을 깔끔한 수식으로 표현시켜 줍니다.

리차드가 오늘 코로나에 걸렸을 확률 을 우리는 "Prior" 라고 합니다.
- 수집한 증거가 없는 경우
리차드가 오늘 코로나에 걸렸을 updated 확률 을 우리는 "Posterior" 라고 합니다.
- 수집한 증거로 "Belief" update
우리가 관측한 증거에 대한 확률(코로나 확진자가 기침을 할 확률) 을 우리는 "update" 라고 합니다.
- 이미 알고 있는 정보(확률)
마지막으로 관측한 증거에 대한 marginal probability(기침을 하는 일반적인 확률)를 "normalization constant" 라고 합니다.
- 이 값은 알려지지 않을 수도 있다. (그 경우 몇가지 techiques 적용)