Probability Notation

구국원·2020년 7월 12일
1

확률과 관련된 공부를 하면서, semicolon(;), commam(,), vertical line(|)이 포함된 probability notation을 많이 보았습니다. 그러나 그 의미가 혼용되어 사용되는 것을 발견하고 그것을 정리하기 위해 포스팅을 작성합니다.

1   P(xθ)P(x|\theta)를 바라보는 2가지 관점

P(xθ)P(x|\theta)는 2가지 관점에서 사용되는 것을 목격할 수 있습니다.

xx를 변수, θ\theta를 상수로 바라보는 관점과 xx를 상수, θ\theta를 변수로 바라보는 관점이 그것입니다. 두 가지 관점은 어느 부분을 더욱 강조할 것인가와 관련되어 있습니다.

1.1   P(xθ)P(x|\theta)xx에 대한 함수(θ\theta는 상수)

θ\theta는 RV가 아니라 상수로 취급되면, P(xθ)P(x|\theta)는 모델의 파라미터 θ\theta가 주었졌을 때의 xx의 확률입니다. θ\theta가 상수이므로(확률변수가 아님) 조건부 확률이라고 부르지 않습니다. 또한 P(xθ)P(x|\theta)P(x;θ)P(x;\theta) 또는 Pθ(x)P_{\theta}(x)로도 표현됩니다.

만일 θ\theta가 RV이면, P(xθ)P(x|\theta)는 조건부 확률이며, P(X,θ)P(θ)\cfrac {P(X, \theta)} {P(\theta)}로 정의됩니다.

1.2   P(xθ)P(x|\theta)θ\theta에 대한 함수(xx는 상수)

이 경우는 P(xθ)P(x|\theta)를 최대로 하는 θ\theta를 찾는 MLE에서의 likelihood를 의미합니다. 이는 L(θx)L(\theta|x)로 표현할 수 있습니다. 따라서 likelihood는 θ\theta에 값을 할당하여 얻을 수 있는 특정 데이터 xx에 대한 확률인 P(xθ)P(x|\theta)을 표기하는 약어(shorthand)에 불과합니다.

따라서 이러한 관점에서의 P(xθ)P(x|\theta)는 objective 함수로 주로 사용됩니다.

2   likelihood

Reference

profile
All About Data Science

0개의 댓글