计算机科学 > 神经与进化计算
[提交于 2025年1月23日
]
标题: 数字事件驱动人工智能加速器中的高效突触延迟实现
标题: Efficient Synaptic Delay Implementation in Digital Event-Driven AI Accelerators
摘要: 神经网络模型的突触延迟参数化一直未被广泛研究,但近期文献显示了有希望的结果,表明延迟参数化模型比具有类似性能(例如任务准确性)的非延迟参数化模型更简单、更小、更稀疏,因此更节能。我们引入了共享循环延迟队列(SCDQ),这是一种用于在数字类脑加速器上支持突触延迟的新硬件结构。我们的分析和硬件结果表明,它在内存方面具有更好的扩展性,比当前常用的的方法更好,并且更容易进行算法-硬件协同优化,在这种情况下,内存扩展由模型稀疏性调节,而不仅仅是网络规模。除了内存外,我们还报告了延迟、面积和每次推理的能量性能。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.