计算机科学 > 分布式、并行与集群计算
[提交于 2025年7月26日
]
标题: 快速运行到空闲:异构CPU和GPU架构上矩阵乘法的能量效率
标题: Racing to Idle: Energy Efficiency of Matrix Multiplication on Heterogeneous CPU and GPU Architectures
摘要: 随着多核和异构计算的范式转变,这是由单核处理器的基本功耗和热限制所推动的,能源效率已成为高性能计算(HPC)中的一类设计约束。 异构系统,将传统的多核CPU与专用加速器如独立(dGPU)和集成(iGPU)图形处理单元相结合,提供了一条有吸引力的路径来权衡性能和功耗之间的关系。 然而,在广泛可访问的硬件上量化这些权衡仍然是一个关键的研究领域。 本文在一台消费级笔记本电脑中的三种不同的计算架构上,对一个典型的HPC工作负载——4096x4096矩阵相乘——进行了直接的实证测量:一个多核AMD Ryzen 7 5800H CPU,一个独立的NVIDIA GeForce GTX 1650 GPU,以及一个集成的AMD Radeon Vega GPU。 使用标准、经过验证且侵入性最小的工具,如Linux perf和nvidia-smi,我们发现独立GPU不仅是性能领先者,其性能比CPU快93.5倍,而且也是最节能的,仅消耗CPU所用能量的2%,从而在能源效率方面提高了50倍。 这些发现提供了“空闲竞赛”原则的实用演示,并为能源感知的软件开发提供了明确的定量指导。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.