Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > cs > arXiv:2306.00352

帮助 | 高级搜索

计算机科学 > 机器学习

arXiv:2306.00352 (cs)
[提交于 2023年6月1日 ]

标题: 提升机器学习中的能量守恒下降法:理论与实践

标题: Improving Energy Conserving Descent for Machine Learning: Theory and Practice

Authors:G. Bruno De Luca, Alice Gatti, Eva Silverstein
摘要: 我们发展了能量守恒下降(ECD)的理论,并引入了ECDSep,这是一种基于梯度的优化算法,能够处理凸优化和非凸优化问题。该方法基于优化作为合适混沌能量守恒动力系统物理演化的新型ECD框架,即使对于没有对称性的通用高维问题,也能实现低损失主导的结果分布的解析控制。与之前对此概念的实现相比,我们利用理论控制来改进动态特性和引发混沌的元素,从而提高性能,同时简化针对不同问题类别的优化算法的超参数调整。我们在广泛的机器学习问题上通过随机梯度下降(SGD)、Adam和AdamW等流行优化方法进行了实证比较,在每个任务中都取得了与其最佳表现相当甚至更优的性能。我们识别出分析中的局限性,指出了进一步改进的可能性。
摘要: We develop the theory of Energy Conserving Descent (ECD) and introduce ECDSep, a gradient-based optimization algorithm able to tackle convex and non-convex optimization problems. The method is based on the novel ECD framework of optimization as physical evolution of a suitable chaotic energy-conserving dynamical system, enabling analytic control of the distribution of results - dominated at low loss - even for generic high-dimensional problems with no symmetries. Compared to previous realizations of this idea, we exploit the theoretical control to improve both the dynamics and chaos-inducing elements, enhancing performance while simplifying the hyper-parameter tuning of the optimization algorithm targeted to different classes of problems. We empirically compare with popular optimization methods such as SGD, Adam and AdamW on a wide range of machine learning problems, finding competitive or improved performance compared to the best among them on each task. We identify limitations in our analysis pointing to possibilities for additional improvements.
评论: 15页+附录,完整代码可用
主题: 机器学习 (cs.LG) ; 天体物理学的仪器与方法 (astro-ph.IM); 高能物理 - 理论 (hep-th); 优化与控制 (math.OC); 机器学习 (stat.ML)
引用方式: arXiv:2306.00352 [cs.LG]
  (或者 arXiv:2306.00352v1 [cs.LG] 对于此版本)
  https://doi.org/10.48550/arXiv.2306.00352
通过 DataCite 发表的 arXiv DOI

提交历史

来自: Giuseppe Bruno De Luca [查看电子邮件]
[v1] 星期四, 2023 年 6 月 1 日 05:15:34 UTC (702 KB)
全文链接:

获取论文:

    查看标题为《》的 PDF
  • 查看中文 PDF
  • 查看 PDF
  • TeX 源代码
  • 其他格式
查看许可
当前浏览上下文:
cs.LG
< 上一篇   |   下一篇 >
新的 | 最近的 | 2023-06
切换浏览方式为:
astro-ph
astro-ph.IM
cs
hep-th
math
math.OC
stat
stat.ML

参考文献与引用

  • NASA ADS
  • 谷歌学术搜索
  • 语义学者
a 导出 BibTeX 引用 加载中...

BibTeX 格式的引用

×
数据由提供:

收藏

BibSonomy logo Reddit logo

文献和引用工具

文献资源探索 (什么是资源探索?)
连接的论文 (什么是连接的论文?)
Litmaps (什么是 Litmaps?)
scite 智能引用 (什么是智能引用?)

与本文相关的代码,数据和媒体

alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)

演示

复制 (什么是复制?)
Hugging Face Spaces (什么是 Spaces?)
TXYZ.AI (什么是 TXYZ.AI?)

推荐器和搜索工具

影响之花 (什么是影响之花?)
核心推荐器 (什么是核心?)
IArxiv 推荐器 (什么是 IArxiv?)
  • 作者
  • 地点
  • 机构
  • 主题

arXivLabs:与社区合作伙伴的实验项目

arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。

与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。

有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.

这篇论文的哪些作者是支持者? | 禁用 MathJax (什么是 MathJax?)
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号