AI 기반심화
상태 공간 모델 (SSM)
State Space Model · SSM · Mamba
상태 공간 모델(SSM)이란 선택적 상태 공간을 사용하여 O(n) 복잡도로 시퀀스를 처리하는 아키텍처다. 대표적인 Mamba는 트랜스포머 대비 추론 처리량이 5배 빠르며, 포스트 트랜스포머 후보로 주목받고 있다.
- •Mamba(Gu & Dao, 2023)가 선택적 상태 공간으로 O(n) 시퀀스 처리를 구현했다. Mamba-2는 1세대 대비 2~8배 빠르다.
- •"Transformers are SSMs" 논문에서 트랜스포머와 SSM의 수학적 이중성을 증명했다.
- •2026년 합의는 하이브리드다. Jamba는 SSM 7 : 어텐션 1 비율로, 범용 작업에서 최적 성능을 보인다.
- •IBM Granite 4.0은 순수 Mamba 구조를 채택하여, 검색이 불필요한 작업에 특화되었다.