计算机科学 > 硬件架构
[提交于 2025年7月22日
]
标题: 具有HW/SW协同设计和多级数据流优化的感知稀疏性的自主路径规划加速器
标题: A Sparsity-Aware Autonomous Path Planning Accelerator with HW/SW Co-Design and Multi-Level Dataflow Optimization
摘要: 路径规划对于自动驾驶至关重要,它根据感知和定位输入生成平滑、无碰撞、可行的路径。 然而,其计算密集性对资源受限的自动驾驶硬件提出了重大挑战。 本文提出了一种面向基于优化的路径规划核心的二次规划(QP)的端到端FPGA加速框架。 我们采用了一种硬件友好的交替方向乘子法(ADMM)来求解QP,并采用可并行化的预条件共轭梯度(PCG)方法来求解线性系统。 通过分析稀疏矩阵模式,我们提出了定制化的存储方案和高效的稀疏矩阵乘法单元,显著减少了资源使用并加速了矩阵运算。 我们的多级数据流优化策略包括操作符内并行化和流水线处理、操作符间细粒度流水线处理以及CPU-FPGA系统级任务映射。 在AMD ZCU102平台上实现,我们的框架实现了最先进的延迟和能效,包括比最佳FPGA设计快1.48倍,比Intel i7-11800H CPU快2.89倍,比ARM Cortex-A57嵌入式CPU快5.62倍,比最先进的GPU解决方案快1.56倍,同时比现有FPGA设计方案的吞吐量提高了2.05倍。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.