Batch Norm, Layer Norm, Instance Norm 너무 많다!! 그리고 각 각은 차원별로 어떻게 연산될 수 있는지 코드와 연결지어서 생각해보자!!
랜덤 변수와 확률 분포
Likelihood, MLE, MAP