최대 가능도 추정(maximum likelihood estimation)

rokky·2023년 4월 3일

통계

목록 보기

14/17

최대 가능도 추정

인터넷에서 x를 N개 수집했다.
이런 N개의 데이터가 정규분포를 따른다고 가정하고, 정규분포를 추정해보자
모수 추정 문제 : 표본 값 x에 대해서는 알고 있지만 모수 θ를 모르는 상황
모멘트 방법 말고, 최대 가능도 추정 사용 가능
이론적으로 가장 가능성이 높은 모수(parameter)를 찾는 방법
모든 추정 중 가장 널리 알려진 방법중 하나
확률 분포 X에 대한 확률 함수를 다음과 같이 표현
p(x; θ)
이때 x는 확률 분포가 가질 수 있는 실수 형태의 값
x,θ 모두 스칼라 또는 벡터
가지고 있는 데이터x를 토대호 모수 θ를 찾는 문제로 이해
즉, 확률 밀도 함수에서 모수를 변수로 간주
가능도 함수 : L(θ; x) = p(x; θ)
추정하고자 하는 확률 분포에 따라 가능도 함수를 다르게 정의 가능
1)베르누이 확률 분포를 추정하는 경우
-> θ = μ
2) 정규분포를 추정하는 경우
-> θ = (μ, σ^2)
최대 가능도 추정은 다음과 같은 문제를 해결하는 것이 목표이다.

-> 가지고 있는 정보를 토대로, 가능도(likelihood)를 최대로 만드는 parameter를 찾는다.

정규분포 추정 예시

정규 분포의 확률 밀도함수는 다음과 같다.
-> 모수 θ를 알고 있으며, 적분했을 때 면적이 항상 1이다.
가능도 함수는 다음과 같다.(x가 상수)
-> 데이터 x를 알고 있으며 적분했을 때 면적이 1이 아닐 수 있다.
분산이 4로 알려져 있고, 값이 5인 데이터를 가지고 있다고 할 때
[5,7,9] 중에서 어떤 값이 평균에 가장 적합할까?

-> 5가 제일 적합

여러개의 데이터가 있는 경우 가능도 측정

N개의 데이터 {x1,x2,...,xN}을 가지고 있는 상황을 고려
각 표본 데이터는 같은 확률 분포에서 나온 독립적인 값이다.
독립적 : x1과 x2는 서로 영향을 주지 않는다.
-따라서 N개의 데이터가 동시에 나올 결합 확률 밀도 함수는
4개의 데이터를 얻은 상황을 가정
{-5, 0, 3, 10}

결과 값이 가능도를 나타내는데 여기서 σ값과 상관없이 μ= 2일때 항상 최대값을 가진다.

정규분포의 최대 가능도 함수를 다음과 같이 정리 할 수 있다.
결과값을 μ와 σ^2으로 미분한 값이 0일 때 가능도 값이 최대가 된다.
식을 전개하면 해는 다음과 같다.

-> 정규분포의 평균은 표본 평균과 같고 분산은 표본 분산과 같다.

이전 포스트

확률 분포 추정

다음 포스트

편향과 오차

0개의 댓글