가능도를 최대화하는 파라미터 𝜃를 찾는 방법
일반적으로 가능도 함수의 미분을 통해 계산
동전 던지기 예제:
데이터의 분포 Pdata 를 어떻게 모델링할까? = 모델 P𝜃 를 어떻게 학습할까?
생성 모델의 학습 - 쿨백-라이블러 발산 최소화
생성 모델의 학습은 최대 가능도를 최적화하며 진행할 수 있음
쿨백-라이블러 발산 (KL Divergence)은 최대 가능도 최적화에 활용 가능한 기준이 됨
그러나 데이터의 정확한 분포를 알 수 없어 이 같은 작업은 바로 적용하기 어려움