计算机科学 > 机器学习
[提交于 2023年6月1日
]
标题: 提升机器学习中的能量守恒下降法:理论与实践
标题: Improving Energy Conserving Descent for Machine Learning: Theory and Practice
摘要: 我们发展了能量守恒下降(ECD)的理论,并引入了ECDSep,这是一种基于梯度的优化算法,能够处理凸优化和非凸优化问题。该方法基于优化作为合适混沌能量守恒动力系统物理演化的新型ECD框架,即使对于没有对称性的通用高维问题,也能实现低损失主导的结果分布的解析控制。与之前对此概念的实现相比,我们利用理论控制来改进动态特性和引发混沌的元素,从而提高性能,同时简化针对不同问题类别的优化算法的超参数调整。我们在广泛的机器学习问题上通过随机梯度下降(SGD)、Adam和AdamW等流行优化方法进行了实证比较,在每个任务中都取得了与其最佳表现相当甚至更优的性能。我们识别出分析中的局限性,指出了进一步改进的可能性。
当前浏览上下文:
cs.LG
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.