[회귀 분석] 1. Linear Regression with One Predictor Variable (3)

그렘린·2022년 7월 24일

Statistics regression analysis

회귀 분석

목록 보기

3/9

Likelihood

likelihood는 한국말로는 우도라고 한다. ~~(제주도 우도 땅콩 막걸리 맛있음)~~ 조금 더 풀어서 설명하자면, 우리가 직접 관측한 데이터가 우리에게 주는 값이라고 생각하면 된다.

예시
10번 동전을 던졌고, 8번의 head가 나왔다면 이러한 정보에 근거해서 우리는 head가 나올 확률을 0.8이라고 말하는 것이 likelihood 이다.

Maximum likelihood estimation

(2)번 글에서도 작성해두었듯이, 관측값 $Y_i$ 의 regression model에서 error는 정규분포를 따른다고 했고 그에 따라 $E(Y_i) = \mathit{\beta}_0+\mathit{\beta}_1X_i$ 이고 $Var(Y_i) = \mathit{\sigma}^2$ 로 표현할 수 있었다.
그렇다면 Pdf(probability density function)을 다음과 같이 쓸 수 있다.

그러면 우리는 $Y_i$ 들을 각각 product한 것을 Likelihood function이라고 할 수 있다.
우리는 분산인 $\mathit{\sigma}^2$ 을 알지 못하기 때문에, Likelihood function은 사실 3가지의 모수를 추정해야하는 것이다. 바로 이 세가지 !! $\mathit{\beta}_0, \mathit{\beta}_1, \mathit{\sigma}^2$

우리는 L이 최대화 되는 모수를 찾을 필요가 있기 때문에 각 변수에 대하여 편미분해서 0이 되는 값을 찾으면 된다.
이 과정에서 있는 그대로를 미분하지 않고, $logL$ 형태로 만들어 이용하는데, 그 이유는 $L$ 과 $logL$ 의 모수들이 만들어내는 최대치는 같기 때문이다.