计算机科学 > 硬件架构
[提交于 2025年8月5日
]
标题: Mamba-X:面向边缘计算设备的端到端视觉Mamba加速器
标题: Mamba-X: An End-to-End Vision Mamba Accelerator for Edge Computing Devices
摘要: Transformer在语言建模中已被证明是有效的,但其计算和内存需求随着输入序列长度的增加呈二次增长,这限制了其应用。状态空间模型(SSMs)通过将注意力复杂度从$O(L^2)$降低到$O(L)$,同时降低整体内存消耗,提供了一个有前景的替代方案。Vision Mamba将SSM方法适应于计算机视觉任务,实现了比传统Transformer模型更低的延迟和内存消耗。然而,由于其顺序扫描操作,将Vision Mamba部署在边缘设备上具有挑战性,这会阻碍GPU效率。我们提出了Mamba-X,这是一种端到端的Vision Mamba加速器,包括一个脉动扫描阵列以最大化并行性并最小化内存流量,以及一种混合的、适合硬件的量化技术,在不牺牲准确性的情况下减少内存使用并提高硬件效率。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.