베이즈 통계학

JH_CHOI·2022년 1월 22일
0
post-custom-banner

베이즈 통계학

중요개념

  • 조건부확률
  • 베이즈 정리
  • 인과관계 추론

목표

베이즈 정리는 데이터가 새로 추가되었을 때 정보를 업데이트하는 방식에 대한 기반이 되므로 오늘날 머신러닝에 사용되는 예측모형의 방법론으로 굉장히 많이 사용되는 개념입니다. 이 때 나오는 사전확률, 사후확률, evidence 등의 개념은 강의에서 나오는 예제를 활용해서 정확히 이해하고 공부합시다.

권고사항

인과관계 추론의 경우, 조건부확률을 섣불리 사용해선 안되는 이유와 중첩효과를 제거함으로써 얻은 인과관계를 어떤 방식으로 활용할 수 있는지에 초점을 두고 공부합시다.

조건부확률이란?

  • 베이즈 통계학을 이해하기 위해선 조건부확률의 개념을 이해해야 합니다.
    • 조건부확률 P(A|B)는 사건 B가 일어난 상황에서 사건 A가 발생할 확률을 의미한다.

  • 베이즈 정리는 조건부확률을 이용하여 정보를 갱신하는 방법을 알려줍니다.
    - A라는 새로운 정보가 주어졌을 때 P(B)로부터 P(B|A)를 계산하는 방법을 제공합니다.

조건부확률 시각화

베이즈정리를 통한 정보의 갱신

  • 베이즈 정리를 통해 새로운 데이터가 들어왔을 때 앞서 계산한 사후확률을 사전확률로 사용하여 갱신된 사후확률을 계산할 수 있습니다.

인과관계

  • 조건부확률은 유용한 통계적 해석을 제공하지만 인과관계(causality)를 추론할 때 함부로 사용해서는 안됩니다.
  • 인과관계는 데이터 분포의 변화에 강건한 예측모형을 만들 때 필요합니다.
  • 인과관계를 알아내기 위해서는 중첩요인(confounding factor)의 효과를 제거하고 원인에 해당하는 변수만의 인과관계를 계산해야 합니다.
profile
꿈이 큰 새싹 개발자입니다.
post-custom-banner

0개의 댓글