计算机科学 > 硬件架构
[提交于 2025年7月6日
]
标题: HLStrans:用于LLM驱动的C到HLS硬件代码合成的数据集
标题: HLStrans: Dataset for LLM-Driven C-to-HLS Hardware Code Synthesis
摘要: 高级综合(HLS)使软件开发人员能够通过使用C/C++而不是传统的硬件描述语言来在更高抽象层次上描述和实现硬件,从而自动生成适合FPGA的设计。 然而,生成HLS代码与标准 C/C++显著不同:它不允许某些编码习惯,依赖于专用库,并且关键需要细粒度的转换和插入优化指令(伪指令)以实现高性能。 大型语言模型(LLMs)在自动化此类转换方面显示出潜力,但现有的开源数据集缺乏足够的复杂性和优化多样性。 为解决这一差距,我们引入了HLStrans数据集,这是一个包含137个不同真实程序的全面集合,每个程序都标注了多种从C到HLS的转换,产生超过23K个标记的设计变体。 这些包括广泛的伪指令和代码级优化。 我们在该数据集上对最先进的LLMs进行基准测试,以评估它们生成可综合的高性能HLS代码的能力。 作为一项持续努力的一部分,我们计划在规模和程序多样性方面扩展HLStrans数据集,进一步推动人工智能和硬件综合交叉领域的研究。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.