数学 > 数值分析
[提交于 2025年4月29日
]
标题: 关于使用少量随机位的随机舍入
标题: On Stochastic Rounding with Few Random Bits
摘要: 大规模数值计算越来越多地使用低精度浮点格式和混合精度算术,这些可以通过随机舍入技术得到增强,即根据中间高精度值距离两个舍入候选值的距离,随机将其向上或向下舍入。 随机舍入除了需要高精度输入值外,还需要随机位的来源。 由于提供高质量的随机位会带来额外的计算成本,因此在保持给定计算或计算域中随机舍入的期望特性的同时,尽量减少所需的位数是有意义的。 本文研究了几种少量位随机舍入的实现方式,并展示了几种自然实现方式如何有时会在舍入过程中引入显著偏差,而在无限位、无限精度的情况下检查这些实现时则不存在这些问题。 文章探讨了这些偏差在机器学习实例中的影响,从而为从业者在开发或采用低精度浮点时应了解的另一类配置参数打开了新的视角。 代码可在http://github.com/graphcore-research/arith25-stochastic-rounding获取。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.