discrete variable이 여러 개 있을 때 거기서 얻을 수 있는 정보량의 공식인데
countinous variable 일 경우에는 위의 식에서 더해주는 것을 적분, 곱해주는 각각의 확률을 변화량(dx)로 바꾸면 된다.
머신러닝 모델은 크게 두 종류이다.
KL-Divergence
Cross Entropy Loss