物理学 > 计算物理
[提交于 2025年1月9日
]
标题: 带约束的带电粒子跟踪的多智能体强化学习优化
标题: Constrained Optimization of Charged Particle Tracking with Multi-Agent Reinforcement Learning
摘要: 强化学习在建模复杂的物理驱动系统方面表现出巨大的成功,通过与模拟或真实环境交互,提供端到端可训练的解决方案,最大化标量奖励信号。 在本工作中,我们提出了一种多智能体强化学习方法,具有分配约束,用于在像素化粒子探测器中重建粒子轨迹。 我们的方法通过联合最小化读出帧中重建轨迹上的总粒子散射量,协作优化一个参数化的策略,该策略作为多维分配问题的启发式方法。 为了满足约束条件,确保粒子击中点的唯一分配,我们提出了一种安全层,为每个联合动作求解一个线性分配问题。 此外,为了强制成本边缘,增加局部策略预测与优化器映射决策边界之间的距离,我们建议在黑盒梯度估计中使用额外组件,迫使策略找到总分配成本较低的解决方案。 我们在为质子成像开发的粒子探测器生成的模拟数据上,实证展示了我们方法的有效性,与多个单智能体和多智能体基线方法相比。 我们进一步证明了带有成本边缘的约束在优化和泛化中的有效性,这些约束通过更广泛的高重建性能区域以及减少的预测不稳定性来实现。 我们的结果为基于强化学习的跟踪技术的进一步发展奠定了基础,既提供了受约束策略的性能提升,又通过个体和团队奖励的选择增强了优化跟踪算法的灵活性。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.