数学 > 优化与控制
[提交于 2020年12月1日
(v1)
,最后修订 2021年9月30日 (此版本, v3)]
标题: 梯度算法在非凸C^{1+alpha}代价函数中的收敛性
标题: Convergence of Gradient Algorithms for Nonconvex C^{1+alpha} Cost Functions
摘要: 本文研究了在非凸设置下带有动量项的随机梯度算法的收敛性。 在较弱的假设下,分析了一类随机动量方法,包括随机梯度下降、heavy ball方法和Nesterov加速梯度方法。 基于期望梯度的收敛结果,通过详细讨论动量和穿越次数的影响,证明了几乎必然收敛。 值得注意的是,对目标函数和步长没有额外的限制。 另一个改进是,现有的梯度Lipschitz条件被放松为Hölder连续性条件。 作为副产品,我们应用了一个局部化过程,将我们的结果扩展到随机步长。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.