참조
https://www.youtube.com/watch?v=XepXtl9YKwc
1. 의미
- "Maximum likelihood를 찾았다" ?
- 관측치에 대한 우도를 최대화 하는 평균 or 표준편차를 찾은것
- 데이터의 분포를 fit하기 위한 최적의 방법(분포)를 찾는 것
2. 예시
3. 딥러닝과의 관계
- 모델의 가중치 θ=(W1,...,WL)
- 소프트맥스 벡터=카테고리분포의 모수 (p1,...,pK) 를 모델링
- 정답 레이블 y=(y1,...,yK) (원핫 인코딩)을 이용, 소프트맥스 벡터의 로그가능도를 최적화
- θMLE^=argmaxθ(n1∑i=1n∑k=1Kyi,klog(MLPθ(xi)k))
- 소프트맥스 벡터의 likelihood를 최적화
- Log likelihood를 사용하는 이유
- 계산의 편의성
- 추정한 분포와 데이터의 거리의 곱으로 가능도를 표현하기 때문에, 그 값의 크기를 줄일 수 있음