
State Space Model for Sequence modeling

Linear State Space Layer : maps a sequence by simulating a linear continuous time state space representation
Efficiently Modeling Long Sequences with Structured State Spaces

Transformer의 대체 아키텍처로 부상중인 Mamba에 대한 literature survey이다. SSM의 시작부터 다양한 variation&application까지 살펴본다.

Mamba-1의 계산적 효율성을 더욱 향상시킨 Mamba-2 논문의 State-Space Duality를 설명한다.

지난 포스트에서는 SSD model의 프레임워크를 살펴보았다면, 이번에는 SSD의 duality에 대해 좀 더 자세히 살펴본다.

여러가지 Foundational Model에 대해 하나의 프레임워크를 구성해 분석한다

(arXiv:2410) STUFFED MAMBA: STATE COLLAPSE AND STATE CAPACITY OF RNN-BASED LONG-CONTEXT MODELING