Variational Autoencoder (VAE)가 최대우도법(MLE, Maximum Likelihood Estimation)을 직접적으로 사용하지 않는 이유는, 잠재 변수z의 존재로 인해 확률 분포를 계산하기가 매우 어렵기 때문입니다. 이 복잡성을 해결하기 위해 변분 추론(Variational Inference)을 사용하여 근사적인 최적화를 수행합니다. 이를 좀 더 구체적으로 설명하겠습니다.
최대우도법(MLE)은 주어진 데이터에 대해 모델의 파라미터 를 최적화하여 데이터를 가장 잘 설명하는 파라미터를 찾는 방법입니다. Autoencoder에서는 비교적 단순한 모델 구조로 인해 MLE를 사용해 손실을 직접 최소화할 수 있습니다.
하지만 VAE에서는 잠재 변수 z가 포함되어 있어, z를 통해 데이터를 설명하는 확률 모델이 필요합니다. 이때 잠재 변수 z는 관측되지 않으므로, 데이터 x의 우도(likelihood) 를 계산하기 위해 잠재 변수 z를 적분해야 합니다:
이 적분은 고차원의 잠재 공간에서 이루어지며, 일반적으로 계산이 매우 복잡하고 불가능에 가깝습니다. 이는 특히 고차원 데이터나 복잡한 모델에서 계산 부담이 큽니다.