Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > cs > arXiv:2507.05012

帮助 | 高级搜索

计算机科学 > 硬件架构

arXiv:2507.05012 (cs)
[提交于 2025年7月7日 ]

标题: 优化下一代无线感知与通信的可扩展多集群架构

标题: Optimizing Scalable Multi-Cluster Architectures for Next-Generation Wireless Sensing and Communication

Authors:Samuel Riedel, Yichao Zhang, Marco Bertuletti, Luca Benini
摘要: 下一代无线技术(用于沉浸式大规模通信、联合通信与感知)需要高度并行的架构来处理大量数据。 一种常见的架构模板通过将数十到数百个核心分组为共享内存集群,然后扩展为多集群多核系统。 这种分层设计被GPU和加速器所采用,需要在较少的大集群和较多的小集群之间取得平衡,这会影响设计复杂性、同步、通信效率和可编程性。 虽然所有多集群架构都必须权衡这些取舍,但关于最优集群大小的见解有限。 本文分析了各种集群配置,重点研究了典型无线感知和通信工作负载的同步、数据移动开销和可编程性。 我们将开源共享内存集群MemPool扩展为多集群架构,并提出了一种新颖的双缓冲屏障,将处理器和DMA解耦。 我们的结果表明,对于内存受限的内核,一个256核集群的速度是16个16核集群的两倍,而对于计算受限的内核,速度最多快24%,这是由于减少了同步和通信开销。
摘要: Next-generation wireless technologies (for immersive-massive communication, joint communication and sensing) demand highly parallel architectures for massive data processing. A common architectural template scales up by grouping tens to hundreds of cores into shared-memory clusters, which are then scaled out as multi-cluster manycore systems. This hierarchical design, used in GPUs and accelerators, requires a balancing act between fewer large clusters and more smaller clusters, affecting design complexity, synchronization, communication efficiency, and programmability. While all multi-cluster architectures must balance these trade-offs, there is limited insight into optimal cluster sizes. This paper analyzes various cluster configurations, focusing on synchronization, data movement overhead, and programmability for typical wireless sensing and communication workloads. We extend the open-source shared-memory cluster MemPool into a multi-cluster architecture and propose a novel double-buffering barrier that decouples processor and DMA. Our results show a single 256-core cluster can be twice as fast as 16 16-core clusters for memory-bound kernels and up to 24% faster for compute-bound kernels due to reduced synchronization and communication overheads.
评论: 6页,8图,已被IWASI 2025接收
主题: 硬件架构 (cs.AR)
引用方式: arXiv:2507.05012 [cs.AR]
  (或者 arXiv:2507.05012v1 [cs.AR] 对于此版本)
  https://doi.org/10.48550/arXiv.2507.05012
通过 DataCite 发表的 arXiv DOI

提交历史

来自: Samuel Riedel [查看电子邮件]
[v1] 星期一, 2025 年 7 月 7 日 13:49:59 UTC (1,699 KB)
全文链接:

获取论文:

    查看标题为《》的 PDF
  • 查看中文 PDF
  • 查看 PDF
  • HTML(实验性)
  • TeX 源代码
  • 其他格式
查看许可
当前浏览上下文:
cs.AR
< 上一篇   |   下一篇 >
新的 | 最近的 | 2025-07
切换浏览方式为:
cs

参考文献与引用

  • NASA ADS
  • 谷歌学术搜索
  • 语义学者
a 导出 BibTeX 引用 加载中...

BibTeX 格式的引用

×
数据由提供:

收藏

BibSonomy logo Reddit logo

文献和引用工具

文献资源探索 (什么是资源探索?)
连接的论文 (什么是连接的论文?)
Litmaps (什么是 Litmaps?)
scite 智能引用 (什么是智能引用?)

与本文相关的代码,数据和媒体

alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)

演示

复制 (什么是复制?)
Hugging Face Spaces (什么是 Spaces?)
TXYZ.AI (什么是 TXYZ.AI?)

推荐器和搜索工具

影响之花 (什么是影响之花?)
核心推荐器 (什么是核心?)
IArxiv 推荐器 (什么是 IArxiv?)
  • 作者
  • 地点
  • 机构
  • 主题

arXivLabs:与社区合作伙伴的实验项目

arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。

与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。

有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.

这篇论文的哪些作者是支持者? | 禁用 MathJax (什么是 MathJax?)
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号