[데이터 분석] Bayesian Inference

Colacan·2022년 1월 28일
1

[데이터 분석]

목록 보기
4/9

베이지안의 사고

  • 주어진 상황에서 추가 데이터가 주어졌을 때 상황을 업데이트

  • 총 확률의 법칙
    1) 모든 가능한 이벤트의 총 확률은 1이다.
    2) 연관이 있는 경우 : B가 일어난 상황에서 A가 일어날 확률 P(A|B)
    3) 연관이 없는 경우 : B가 일어난 상황에서 A가 일어날 확률 P(A)*P(B)

  • 조건부 확률
    1) B가 주어진 상황에서의 A의 확률 = A가 주어진 상황에서의 B의 확률 * A의 확률 / B의 확률
    2) A의 확률 : 사전확률
    3) B가 주어진 상황에서의 A의 확률 : 사후확률
    4) A가 주어진 상황에서의 B의 확률 : likelihood(가능도)

  • 위를 통해 사전확률을 업데이트 가능

  • 베이지안 테스트를 반복하여 사용

  • 업데이트를 할 때마다 점점 정교해짐

몬티홀 with 베이지안

  • 처음에 1번문을 선택

  • H : 1번 문뒤에 자동차가 있음

  • E : 진행자가 염소 있는 문을 1개 열어줌

  • 우리가 구해야할 것
    1) P(E|H) : 1번문에 자동차가 있는 상황에서 진행자가 염소있는 문을 열어줄 확률 = 1
    2) P(H) : 자동차가 1번문에 있을 확률 = 1/3
    3) P(E|not H) : 자동차가 없는 상황에서 염소있는 문 열어줄 확률 = 1
    4) P(not H) : 자동차 없을 확률 = 2/3

  • 위를 통해서 P(H/E) 계산하면 1/3

베이지안 이용

  • TPR : True Positive Rate, 민감도, 1인 케이스를 1로 예측

  • FPR : False Positive Rate, 1-특이도, 0인 케이스를 1로 잘못 예측

  • 이전 계산의 사후확률을 새로운 계산의 사전확률로 사용

  • 베이지안을 통해서 신뢰구간을 추정할 수 있다

Bayesian Optimize

  • 모델에 쓰일 파라미터에 따라서 성능이 달라짐

  • Optimize: 이러한 파라미터를 결정하는 과정

  • 이러한 방법 중 하나로 베이지안 이용가능

  • 그리드 방식 : 모든 파라미터에 대해서 시행

  • 베이지안 방식 : 점부터 시작해서 차차 업데이트해감 (그리드보다 효율적이거나 동일)

profile
For DE, DA / There is no royal road to learning

0개의 댓글