240529 TIL #411 AI Tech #25 베이즈 통계학

김춘복·2024년 5월 28일
0

TIL : Today I Learned

목록 보기
411/575

Today I Learned

오늘 공부한 내용은 베이즈 통계학!


베이즈 통계학

  • 조건부 확률
    사건 B가 일어난 상황에서 사건 A가 발생할 확률

  • 베이즈 정리
    조건부 확률을 이용해서 정보를 갱신하는 방법을 알려준다

용어

  • D = 새로 관찰하는 데이터 / 세타 = 모델링하는 이벤트 (hypothesis, 모수)
  • 사후확률 = 데이터를 관찰한 후, 이 hypothesis가 성립할 확률
  • 사전확률 = 데이터가 주어지지 않은 상황에서 주어진 확률

예시

전염병 발병율이 10%, 실제로 걸렸을때 검진될 확률 99%, 걸리지 않았을 때 오검진율 1%.
어떤 사람이 걸렸다고 결과가 나왔을 때 진짜 감염됐을 확률은?

  • 사전확률 P(θ) = 0.1 /// P(ㄱθ) = 0.9
  • 가능도 P(D|θ) = 0.99 ///// P(D|ㄱθ) = 0.01
  • P(θ|D) = P(θ) * P(D|θ) / P(D) = 0.1 * 0.99 / 0.108 = 0.916

시각화

  • 1종오류와 2종오류 어떤걸 더 줄여야할지는 데이터 특성에 따라서 달라진다.

정보 갱신

  • 베이즈정리를 통해 새로운 데이터가 들어왔을때 앞서 계산한 사후확률을 사전확률로 사용해 갱신된 사후확률을 계산할 수 있다.

인과관계

  • 조건부 확률이 유용하긴 하지만 인과관계(causality)를 추론할 때 함부로 사용하면 안된다.

  • 인과관계는 데이터 분포의 변화에 강건한 예측 모형을 만들 때 필요하다.

  • 인과관계를 알아내기 위해서 중첩요인(confounding factor)의 효과를 제거하고 원인에 해당하는 변수만의 인과관계를 계산해야한다. (다른 인자의 인과관계 제거)

  • 조정(intervention)효과를 통해 다른인자 Z의 개입을 제거할 수 있다.


본 포스트의 학습 내용은 부스트클래스 <AI 엔지니어 기초 다지기 : 부스트캠프 AI Tech 준비과정> 강의 내용을 바탕으로 작성되었습니다.

profile
Backend Dev / Data Engineer

0개의 댓글