计算机科学 > 硬件架构
[提交于 2025年7月7日
]
标题: 优化下一代无线感知与通信的可扩展多集群架构
标题: Optimizing Scalable Multi-Cluster Architectures for Next-Generation Wireless Sensing and Communication
摘要: 下一代无线技术(用于沉浸式大规模通信、联合通信与感知)需要高度并行的架构来处理大量数据。 一种常见的架构模板通过将数十到数百个核心分组为共享内存集群,然后扩展为多集群多核系统。 这种分层设计被GPU和加速器所采用,需要在较少的大集群和较多的小集群之间取得平衡,这会影响设计复杂性、同步、通信效率和可编程性。 虽然所有多集群架构都必须权衡这些取舍,但关于最优集群大小的见解有限。 本文分析了各种集群配置,重点研究了典型无线感知和通信工作负载的同步、数据移动开销和可编程性。 我们将开源共享内存集群MemPool扩展为多集群架构,并提出了一种新颖的双缓冲屏障,将处理器和DMA解耦。 我们的结果表明,对于内存受限的内核,一个256核集群的速度是16个16核集群的两倍,而对于计算受限的内核,速度最多快24%,这是由于减少了同步和通信开销。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.