Maximum Likelihood Estimation

‍이세현·2024년 6월 3일
1

Likelihood

ProbabilityLikelihood
확률가능도
확률분포 고정관측된 사건 고정(모든 데이터를 대변하는 것은 아님)
관측되는 사건이 변화확률 분포가 변화(혹은 모름)

지금 얻은 데이터 xx가 해당 분포 θ\theta로부터 나왔을 가능성

Likelihood를 계산하기 위해서는 각 데이터 샘플에서 후보 분포에 대한 높이 likelihood를 계산해서 모두 곱해야 한다.
이때 더하지 않고 곱하는 것은 모든 데이터의 추출이 독립적으로 연달아 일어나는 사건이기 때문이다.

MLE 정의

  • 최대우도법: 모수가 될 데이터가 있을 때 데이터의 밀도를 추정하는 방법
  • 파라미터 θ\theta로 구성된 어떤 확률 밀도 함수 P(xθ)P(x|\theta)에서 관측된 표본 데이터 집합을 xx라 할 때 파라미터 θ\theta를 추정하는 방법

Toy Example

데이터 x=1,4,5,6,9x={1,4,5,6,9} (데이터는 Random 변수가 아니다)

데이터 xx는 주황색 곡선으로부터 추출되었을 확률이 더 높다.

P(xθ)=k=1nP(xkθ)P(x|\theta)=\prod_{k=1}^{n}P(x_k|\theta)

어떠한 분포 θ\theta에서 데이터가 나올 확률의 곱이 크면 θ\theta는 분포를 가장 잘 나타낸 것이다.

위 식의 결과가 가장 커지는 θ\thetaθ^\hat{\theta}로 보는 것이 가장 그럴듯하다.

일반적으로 소숫점 계산을 해결하기 위해 자연로그를 이용해서 log-likelihood function L(θx)L(\theta|x)를 이용한다.

L(θx)=logP(xθ)=i=1nlogP(xiθ)θ=argmaxθL(θx)L(\theta|x)=\log{P(x|\theta)}=\sum_{i=1}^{n}\log{P(x_i|\theta)} \\ \theta^{\star}={\arg\max}_\theta L(\theta|x)

최댓값 찾는 방법

log\log 함수는 단조증가 함수이기 때문에 likelihood function과 log-likelihood의 최댓값을 갖게 하는 입력값은 동일하다.

따라서 계산의 편의를 위해 log-likelihood의 최댓값을 찾는다.

찾고자 하는 파라미터 θ\theta에 대해 편미분하고 그 값이 0이 되도록 하는 θ\theta를 찾는 과정을 통해 likelihood 함수를 최대화할 θ\theta를 찾을 수 있다.

θL(θx)=θlogP(xθ)=i=1nθlogP(xiθ)\frac{\partial}{\partial\theta}L(\theta|x)= \frac{\partial}{\partial\theta}\log{P(x|\theta)}= \sum_{i=1}^{n}\frac{\partial}{\partial\theta}\log{P(x_i|\theta)}
profile
Hi, there 👋

0개의 댓글

관련 채용 정보