计算机科学 > 机器人技术
[提交于 2025年7月1日
]
标题: 基于自进化先验的极端单足运动跳跃启动强化学习
标题: Jump-Start Reinforcement Learning with Self-Evolving Priors for Extreme Monopedal Locomotion
摘要: 强化学习(RL)在使四足机器人实现敏捷运动方面显示出巨大潜力。 然而,由于早期阶段的不稳定性交互和不可靠的奖励反馈,直接训练策略同时应对极端欠驱动和极端地形等双重极端挑战,如单足跳跃任务中所遇到的,仍然极具挑战性。 为了解决这个问题,我们提出了JumpER(通过自我演化先验的跳跃启动强化学习),这是一种将策略学习分为多个复杂度逐步增加阶段的RL训练框架。 通过迭代自举之前学到的策略动态生成自我演化先验,JumpER逐步优化并增强指导,从而在不依赖外部专家先验或手工设计奖励塑造的情况下稳定探索和策略优化。 具体而言,当与一个结构化的三阶段课程相结合,该课程逐步演化动作模态、观测空间和任务目标时,JumpER使四足机器人首次能够在不可预测的地形上实现稳健的单足跳跃。 值得注意的是,所产生的策略有效处理了传统方法难以克服的挑战性场景,包括最大达60厘米的宽缝、不规则间距的楼梯以及距离在15厘米到35厘米之间的踏石。 因此,JumpER为应对极端欠驱动和极端地形的双重挑战提供了系统且可扩展的解决方案。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.