This paper studies two big ideas in neuroscience: criticality and efficient coding
random noise enhances exploring multiple attractors
In this paper, they recorded neural activity in grid cells and place cells when rats ran through a hairpin maze.
HMM (forward-backward algorithm) study and implementation
concept space, signal strength, learning dynamics and trajectories, phenomenological model, sudden transition in learning phase, underspecification
curse of memory: the necessity of memory decay for approximation
curriculum learning, attractor formation
tried to quantify the concept of compositionality through the lens of Kolmogorov complexity, algorithmic information quantity
they observed the fundamentals of RNN behavior - simplicity bias, a tendency to share attractors and reuse dynamics.
task period dynamics, representation, task compositionality
task representation, compositionality
Decision making, motor task, uncertainty 관련해서 2000년대 꽤나 현재 연구의 초석이 되는 두 논문을 간단히 정리한 내용이다.
Motor planning 시 (control) signal-dependent noise 와 함께 final position variance 를 minimize 하는 방향으로 trajectory 가 optimize 된다는 이론을 설명한다.
cognitive map 을 학습하고 이용하는 과정에서 abstract structural knowledge 를 추출하고 이를 다른 task 에 transfer 한다는 것을 모델링, 행동 실험 결과로 보인 논문이다.
structural abstraction, sensory experience 의 conjuction 으로써 relational memory 를 표현하는 model (TEM) 을 통해 타 모델에선 불가능했던 분석을 수행하고 remapping 과 관련된 새로운 관찰 얻음
Kalman Smoother, Unscented Kalman Filter (with sigma points)
MCQ 방식은 기존 방식에서의 value function underestimation (pessimism) 을 보완하고자 OOD action 에 대해 pseudo target value 를 할당하여 model 이 suboptimal traj 에 stitch 하도록 함
Implicit Q-Learning (IQL) 은 in distribution action Q value 의 상위 expectile 을 예측하는 model 을 통해 offline RL 의 distributional shift 를 피하고자 한 model-free 방식.
Conservative Q-Learning (model-free offline reinforcement learning)
Probabilistic Machine Learning 의 Chapter 8 인 Gaussian filtering and smoothing 에 대해 정리하고자 한다. 이번 포스트에는 8.4 Inference based on the unscented transform 까