Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > cs > arXiv:2003.02981

帮助 | 高级搜索

计算机科学 > 机器学习

arXiv:2003.02981 (cs)
[提交于 2020年3月6日 (v1) ,最后修订 2020年6月29日 (此版本, v2)]

标题: 模拟退火的学习复杂度

标题: Learning Complexity of Simulated Annealing

Authors:Avrim Blum, Chen Dan, Saeed Seddighin
摘要: 模拟退火是一种有效且通用的优化方法。 它实际上受到冶金学的启发,在冶金学中,材料的温度决定了其在热力学中的行为。 同样地,在模拟退火中,算法采取的动作完全取决于一个变量的值,这个变量捕捉了温度的概念。 通常,模拟退火从一个高温开始,这使得算法相当不可预测,然后逐渐降低温度以变得更为稳定。 在模拟退火性能中起关键作用的一个组成部分是温度变化的标准,即冷却计划。 受此启发,我们在本工作中研究以下问题:“给定特定类别的优化问题的足够样本,我们能否设计出最优(或近似最优)的冷却计划,使得当底层问题从同一类中均匀随机抽取时,算法的运行时间最小化或成功率最大化?” 我们在样本复杂性和模拟复杂性方面都提供了积极的结果。 在样本复杂性方面,我们证明$\tilde O(\sqrt{m})$个样本足以找到长度为$m$的近似最优冷却计划。 我们通过给出任何提供几乎最优冷却计划的学习算法的样本复杂性的下界$\tilde \Omega(m^{1/3})$来补充这一结果。 这些结果是普遍的,不依赖于任何假设。 然而,在模拟复杂性方面,我们做出了额外的假设来衡量算法的成功率。 为此,我们引入了单调平稳图,该图对模拟退火的性能进行了建模。 基于此模型,我们提出了具有可证明保证的多项式时间算法来解决学习问题。
摘要: Simulated annealing is an effective and general means of optimization. It is in fact inspired by metallurgy, where the temperature of a material determines its behavior in thermodynamics. Likewise, in simulated annealing, the actions that the algorithm takes depend entirely on the value of a variable which captures the notion of temperature. Typically, simulated annealing starts with a high temperature, which makes the algorithm pretty unpredictable, and gradually cools the temperature down to become more stable. A key component that plays a crucial role in the performance of simulated annealing is the criteria under which the temperature changes namely, the cooling schedule. Motivated by this, we study the following question in this work: "Given enough samples to the instances of a specific class of optimization problems, can we design optimal (or approximately optimal) cooling schedules that minimize the runtime or maximize the success rate of the algorithm on average when the underlying problem is drawn uniformly at random from the same class?" We provide positive results both in terms of sample complexity and simulation complexity. For sample complexity, we show that $\tilde O(\sqrt{m})$ samples suffice to find an approximately optimal cooling schedule of length $m$. We complement this result by giving a lower bound of $\tilde \Omega(m^{1/3})$ on the sample complexity of any learning algorithm that provides an almost optimal cooling schedule. These results are general and rely on no assumption. For simulation complexity, however, we make additional assumptions to measure the success rate of an algorithm. To this end, we introduce the monotone stationary graph that models the performance of simulated annealing. Based on this model, we present polynomial time algorithms with provable guarantees for the learning problem.
评论: 40页
主题: 机器学习 (cs.LG) ; 机器学习 (stat.ML)
引用方式: arXiv:2003.02981 [cs.LG]
  (或者 arXiv:2003.02981v2 [cs.LG] 对于此版本)
  https://doi.org/10.48550/arXiv.2003.02981
通过 DataCite 发表的 arXiv DOI

提交历史

来自: Chen Dan [查看电子邮件]
[v1] 星期五, 2020 年 3 月 6 日 00:49:03 UTC (1,534 KB)
[v2] 星期一, 2020 年 6 月 29 日 21:17:37 UTC (1,483 KB)
全文链接:

获取论文:

    查看标题为《》的 PDF
  • 查看中文 PDF
  • 查看 PDF
  • TeX 源代码
查看许可
当前浏览上下文:
cs.LG
< 上一篇   |   下一篇 >
新的 | 最近的 | 2020-03
切换浏览方式为:
cs
stat
stat.ML

参考文献与引用

  • NASA ADS
  • 谷歌学术搜索
  • 语义学者
a 导出 BibTeX 引用 加载中...

BibTeX 格式的引用

×
数据由提供:

收藏

BibSonomy logo Reddit logo

文献和引用工具

文献资源探索 (什么是资源探索?)
连接的论文 (什么是连接的论文?)
Litmaps (什么是 Litmaps?)
scite 智能引用 (什么是智能引用?)

与本文相关的代码,数据和媒体

alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)

演示

复制 (什么是复制?)
Hugging Face Spaces (什么是 Spaces?)
TXYZ.AI (什么是 TXYZ.AI?)

推荐器和搜索工具

影响之花 (什么是影响之花?)
核心推荐器 (什么是核心?)
IArxiv 推荐器 (什么是 IArxiv?)
  • 作者
  • 地点
  • 机构
  • 主题

arXivLabs:与社区合作伙伴的实验项目

arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。

与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。

有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.

这篇论文的哪些作者是支持者? | 禁用 MathJax (什么是 MathJax?)
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号