여기서의 parameter은 data dependent한 decay로서 과거 정보를 얼마나 반영할지를 결정할 수 있게 된다.
surprise metric의 objective는 loss function으로 정의된다. 결국 우리의 모델은 meta learning으로 objective를 배우게 되는 것이다.
Associative memory 관점에서 우리는 key, query, value 개념으로 메모리 구조를 파악할 수 있을 것이며 이를 이용하여 loss를 정의할 수 있다.
이 Loss function은 inner loop의 memory에 대한 것이므로, key, value의 weight update에는 관여하지 않는다. 즉, hyperparameter로 기능하게 된다. 따라서 inner loop에서는 memory의 weight를, outer loop 에서는 다른 파라미터들을 업데이트하며 학습하게 된다.
Forgetting mechanism은 장기 기억에 있어서 얼마나 ‘잊을지’를 결정하는 방법이다. alpha를 이용하여, 한정된 공간에 최대한 효율적으로 메모리를 저장하고자 얼마나 기억하고 잊을지를 조절한다.