计算机科学 > 机器人技术
[提交于 2024年11月2日
]
标题: 领域随机化在全身类人机器人控制扩散策略训练中的作用
标题: The Role of Domain Randomization in Training Diffusion Policies for Whole-Body Humanoid Control
摘要: 人形机器人有潜力成为为人类设计的环境中理想的具身形式。由于它们与人体结构相似,因此能够从丰富的演示数据中受益,例如通过遥操作、运动捕捉甚至使用人类执行任务的视频收集的数据。然而,从演示中提炼策略仍然是一项具有挑战性的问题。尽管扩散策略(DPs)在机器人操作方面表现出令人印象深刻的结果,但它们在步态控制和人形机器人控制中的适用性仍未得到充分探索。本文研究了数据集多样性和规模如何影响DPs在人形机器人全身控制中的性能。在模拟的IsaacGym环境中,我们通过在各种领域随机化(DR)条件下训练对抗性运动先验(AMP)代理生成合成演示,并比较适用于不同规模和多样性的数据集的DPs。我们的研究结果显示,虽然DPs可以实现稳定的行走行为,但在步态策略的成功训练需要比操作任务显著更大且更多样化的数据集,即使在简单的场景下也是如此。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.