Posterior 뜻

About_work·2024년 1월 5일
0

개념


  • 간단히 말해, Posterior(사후 확률)
    • 새로운 정보를 얻은 후에 -> 어떤 사건이나 가설에 대한 우리의 확신을 업데이트하는 방법

  • "Posterior(사후 확률)": 어떤 사건이 발생한 후에, 우리가 가지고 있는 정보나 믿음을 업데이트하는 데 사용되는 확률 개념
  • 사후 확률은 우리가 새로운 정보를 얻었을 때, 어떤 가설이나 사건의 확률을 다시 계산하는 것

  • 이를 이해하기 위해, 먼저 '사전 확률(Prior Probability)'과 '우도(Likelihood)'라는 두 개념을 알아야 합니다:

  1. 사전 확률 (Prior Probability)
  • 이는 어떤 사건이나 가설에 대해, 새로운 증거를 얻기 전에 우리가 가진 믿음이나 추정
  • 예를 들어, "이 주사위는 공정하다"라는 가설의 사전 확률은 1/6

  1. 우도 (Likelihood)
  • 새로운 증거나 데이터가 주어졌을 때, 이 증거가 특정 가설이나 사건과 얼마나 잘 맞는지를 나타내는 확률
  • 예를 들어, "주사위를 던져서 6이 나왔다"는 증거가 있을 때, "이 주사위는 조작되었다"는 가설의 우도를 계산할 수 있습니다.

  • 이제 '사후 확률 (Posterior Probability)'로 넘어가 보겠습니다:

  • 사후 확률 (Posterior Probability):
    • 이는 새로운 증거를 고려한 후에 어떤 가설이나 사건에 대해 다시 계산한 확률
    • 사후 확률 = 사전 확률과 새로운 증거의 우도를 결합
    • 이는 베이즈 정리를 통해 계산되는데,
      • 간단히 말해, 새로운 정보가 들어왔을 때 우리의 믿음이나 추정을 어떻게 업데이트해야 하는지를 알려주는 방법

  • 예를 들어, "이 주사위는 공정하다"는 가설의 사전 확률이 1/6이고, 여러 번 던져서 대부분 6이 나왔다는 새로운 증거가 있다면, 이 가설의 사후 확률은 사전 확률보다 낮아질 것입니다.
    • 즉, 새로운 증거를 바탕으로 "이 주사위는 공정하지 않다"는 새로운 믿음을 갖게 됩니다.

본문

  • state posterior을 오직 바로 이전의 observation과 action의 곱으로 가정. 을 이해해보자.

  • 에이전트가 현재 상태에 대해 어떻게 확신을 가지게 되는지를 설명하고 있습니다.
  • agent가 가지는 현재 상태에 대한 확신이 오직 바로 이전에 에이전트가 관찰한 것과 그가 취한 행동에만 기반한다고 가정
  • "state posterior": '상태 사후 확률'
    • 사후 확률은 새로운 증거를 바탕으로 특정 상태에 대한 확신을 업데이트하는 것을 의미
  • "바로 이전의 observation과 action의 곱으로 가정":
    • 상태 사후 확률을 계산할 때 사용하는 정보에 관한 것
    • 'observation'은 에이전트가 관찰한 정보, 즉 환경에서 얻은 입력 데이터를 의미
    • 'action'은 에이전트가 취한 행동을 의미
    • 이 문장에서는 상태 사후 확률을 계산할 때, 바로 이전의 관찰과 행동 정보만을 사용한다고 가정
profile
새로운 것이 들어오면 이미 있는 것과 충돌을 시도하라.

0개의 댓글