[데이터 분석] Bayesian Inference

Colacan·2022년 1월 28일

1

[데이터 분석]

목록 보기

4/9

베이지안의 사고

주어진 상황에서 추가 데이터가 주어졌을 때 상황을 업데이트
총 확률의 법칙
1) 모든 가능한 이벤트의 총 확률은 1이다.
2) 연관이 있는 경우 : B가 일어난 상황에서 A가 일어날 확률 P(A|B)
3) 연관이 없는 경우 : B가 일어난 상황에서 A가 일어날 확률 P(A)*P(B)
조건부 확률
1) B가 주어진 상황에서의 A의 확률 = A가 주어진 상황에서의 B의 확률 * A의 확률 / B의 확률
2) A의 확률 : 사전확률
3) B가 주어진 상황에서의 A의 확률 : 사후확률
4) A가 주어진 상황에서의 B의 확률 : likelihood(가능도)
위를 통해 사전확률을 업데이트 가능
베이지안 테스트를 반복하여 사용
업데이트를 할 때마다 점점 정교해짐

몬티홀 with 베이지안

처음에 1번문을 선택
H : 1번 문뒤에 자동차가 있음
E : 진행자가 염소 있는 문을 1개 열어줌
우리가 구해야할 것
1) P(E|H) : 1번문에 자동차가 있는 상황에서 진행자가 염소있는 문을 열어줄 확률 = 1
2) P(H) : 자동차가 1번문에 있을 확률 = 1/3
3) P(E|not H) : 자동차가 없는 상황에서 염소있는 문 열어줄 확률 = 1
4) P(not H) : 자동차 없을 확률 = 2/3
위를 통해서 P(H/E) 계산하면 1/3

베이지안 이용

TPR : True Positive Rate, 민감도, 1인 케이스를 1로 예측
FPR : False Positive Rate, 1-특이도, 0인 케이스를 1로 잘못 예측
이전 계산의 사후확률을 새로운 계산의 사전확률로 사용
베이지안을 통해서 신뢰구간을 추정할 수 있다

Bayesian Optimize

모델에 쓰일 파라미터에 따라서 성능이 달라짐
Optimize: 이러한 파라미터를 결정하는 과정
이러한 방법 중 하나로 베이지안 이용가능
그리드 방식 : 모든 파라미터에 대해서 시행
베이지안 방식 : 점부터 시작해서 차차 업데이트해감 (그리드보다 효율적이거나 동일)

For DE, DA / There is no royal road to learning

이전 포스트

[데이터 분석] Linear Algebra+

다음 포스트

[데이터 분석] Confidence Interval

0개의 댓글