빈도주의 확률 VS 베이지안 확률
🎲 빈도주의(Frequentist) 확률 :
반복 가능한 실험 : 어떤 사건이 무한히 반복되었을 때의 비율로 해석하며, 객관적인 수치이다.
공정한 실험을 가정 : 실험을 충분히 많이 반복하면 그 비율은 수렴한다고 가정한다.
🧠 베이지안(Bayesian) 확률 :
주관적인 믿음의 정도 : 확률을 어떤 명제가 참일 것이라고 믿는 정도, 즉 주관적인 믿음의 크기로 해석한다.
정보에 따른 갱신 : 확률은 우리가 가지고 있는 정보에 따라 바뀔 수 있으며, 정보가 갱신되면 믿음도 함께 갱신되어야 한다.
✅ 주요 차이점 정리
| 항목 | 빈도주의 | 베이지안 |
|---|---|---|
| 확률 해석 | 장기적 비율 | 믿음(주관적 확률) |
| 핵심 개념 | 반복 실험, 표본공간 | 정보 갱신, 조건부 확률 |
| 공정성 | 전제 | 추론 대상 |
| 시간 개념 | 반복 실험 전제 → 간접적 시간 흐름 | 없음, 정보 기준 |
| 사건 발생 | 객관적 현실 | 조건부 정보 입력 |
| 예시: 주사위 | 6이 나올 확률은 1/6 | 공정하다고 믿으면 1/6, 아니면 다르게 설정 |
빈도주의가 객관적이고 반복 가능한 실험에서 강점을 가진다면, 베이지안은 정보가 제한된 상황, 사건이 한 번만 일어나는 상황, 사전 지식이 중요한 상황에서 강력한 도구가 된다.
베이지안에서는 단순히 "확률이 0.6이다"라고 말하는 대신, 그 확률이 어떤 믿음을 바탕으로 했는지, 그리고 그 믿음은 어떻게 바뀌는지를 함께 고민할 수 있다.
베이지안 기초 확률 개념
- 빈도주의에서 배운 개념(곱의 법칙, 합의 법칙)을 수학적으로는 동일하게 사용할 수 있지만, 해석 방식과 활용 목적이 다르다.
베이지안에서는 모든 확률을 조건부 확률로 해석한다 (전체 확률의 법칙 기반)
베이지안에서는 확률 도 사실은 처럼 어떤 배경 지식 하에서 정의된 조건부 확률로 간주한다.
즉, 무조건적인 확률처럼 보이는 것도 실제로는 어떤 정보가 전제된 해석이다.
독립 사건
일반적 수학 표현 :
베이지안 해석 : 정보 가 에 대한 믿음을 바꾸지 않을 때, A와 B는 독립이다.
종속 사건 :
배반 사건 :
일반적 수학 표현 :
베이지안 해석 : 정보적 배타성으로 해석한다
즉, 가능한 서로 다른 가설 A와 B 중 하나만 참일 수 있다는 믿음을 의미한다.
베이즈 정리
- 아직 어떤 데이터 𝐷도 관측하지 않았을 때, 가설 𝐻의 그럴듯함을 로 표현한다.
- 사건 𝐷에 대한 정보를 관측하게 되었을 때, 이 정보를 바탕으로 를 갱신할 수 있다.
✅
| 항목 | 의미 | 해석 |
|---|---|---|
Prior | 를 고려하지 않았을 때 가 성립할 것이라고 믿는 정도(사전 확률) | |
Evidence | 가 관측될 전체 확률(정규화 상수 역할) | |
Likelihood | 가 옳다고 가정했을 때, 가 관측될 확률 | |
Posterior | 가 주어졌을 때, 가 옳을 확률(업데이트된 사후 확률) |
우리가 기존에 에 대한 지식이 있다면?
우리가 기존에 에 대한 지식이 없다면?
베이지안 추정 (Bayesian estimation)
- 빈도주의 추정에서는 모수를 고정된 값으로 보며, 그 최적값을 계산한다(optimize)
- 베이지안 추정에서는 모수를 확률변수로 보며, 사후 분포로부터 모수의 확률 분포를 추정한다.
베이지안 추정 - 평균
- 관측값 :
- / 은 고정값으로 가정한다.
우도 함수 (Likelihood)
가 주어졌을 때, 가 관측될 확률(우도 함수)는 다음과 같다
상수항을 무시하고, 정리하면 :
사전 분포 (Prior)
사전 분포는 가 주변에 있을 것 같다는 주관적 믿음을 나타내며
불확실성의 정도를 으로 표현한다.
이를 수식으로 나타내면 :
상수항을 무시하고 정리하면 :
사후 분포 (Posterior)
베이즈 정리에 의해 :
의 식에 을 대입하면 :
위 식을 정리하면 :
이때, 확률 변수인 가 관여하는 항만 유지하면 :
의 식을 일반적인 정규분포의 지수 꼴로 변환하면,
일반적인 정규분포의 지수 꼴 :
✅ 해석 : 베이지안 평균 추정값(사후 평균)은 "사전 정보"와 "데이터"의 가중평균
사후 평균을 정리하면 다음과 같다 :
이 식은, 우리가 에 대해 믿고 있던 사전 정보()에 관측한 정보인 데이터()를 고려하여 믿음을 업데이트한 결과이다.
사전 정보의 불확실성이 작아질수록( ↓) → 에 더 큰 비중
데이터가 많아질수록 ( ↑) → 에 더 큰 비중
사후 평균의 불확실성은 사후 분산()으로 측정할 수 있으며, 다음과 같은 특징을 가진다.
사전 정보의 불확실성이 작아질수록( ↓) → 사후 분산이 작아진다
데이터가 많아질수록 ( ↑) → 사후 분산이 작아진다