计算机科学 > 机器学习
[提交于 2025年8月14日
]
标题: 基于强化学习的非局部蒙特卡罗方法
标题: Nonlocal Monte Carlo via Reinforcement Learning
摘要: 优化组合优化问题的复杂成本函数是一个跨学科和应用领域的长期挑战。 当采用基于马尔可夫链蒙特卡洛(MCMC)的传统算法家族,如模拟退火或并行温度法时,假设输入上的温度分布是均匀的(平衡的)。 这种与实例无关的方法在重叠间隙性质成立时,对于接近计算相变的最难基准测试被证明是无效的。 在这些情况下,传统的MCMC难以解除刚性变量,逃出次优吸引盆地,并采样高质量且多样的解决方案。 为了缓解这些挑战,提出了非平衡非局部蒙特卡洛(NMC)算法,该算法利用不均匀的温度分布,从而在不损害其开发的情况下加速配置空间的探索。 在这里,我们使用深度强化学习(RL)来训练NMC的非局部转移策略,这些策略之前是通过现象学设计的。 我们证明,该求解器仅通过观察配置空间探索的能量变化作为RL奖励,以及局部最小能量景观几何作为RL状态即可进行训练。 我们进一步表明,训练后的策略在残余能量、求解时间和解决方案多样性指标方面优于标准的基于MCMC的和非局部模拟退火方法,在硬均匀随机和无标度随机4-SAT基准测试中表现更佳。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.