计算机科学 > 机器人技术
[提交于 2025年7月15日
]
标题: 海洋探测者:一种用于水下任务的AUV鲁棒控制的扩散增强强化学习
标题: Ocean Diviner: A Diffusion-Augmented Reinforcement Learning for AUV Robust Control in the Underwater Tasks
摘要: 本文提出了一种扩散增强的强化学习(RL)方法,用于鲁棒的自主水下航行器(AUV)控制,解决了水下轨迹规划和动态环境适应中的关键挑战。 所提出的方法集成了三个核心创新:(1)一种基于扩散的轨迹生成框架,能够生成物理可行的多步骤轨迹,通过一种新颖的扩散U-Net架构将当前观测与历史状态和动作结合,实现高维状态编码机制,显著提高了长时程规划的效果。 (2)一种样本高效的混合学习架构,将扩散引导的探索与RL策略优化相结合,其中扩散模型生成多样化的候选动作,而RL评论家选择最优动作,在动态水下环境中实现了更高的探索效率和策略稳定性。 大量的仿真实验验证了该方法的优越鲁棒性和灵活性,在复杂的海洋条件下优于传统控制方法,为水下任务中的AUV操作提供了增强的适应性和可靠性。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.