计算机科学 > 机器人技术
[提交于 2025年7月15日
]
标题: 创始人:在世界模型中建立基础模型以实现开放式的具身决策
标题: FOUNDER: Grounding Foundation Models in World Models for Open-Ended Embodied Decision Making
摘要: 基础模型(FMs)和世界模型(WMs)在不同层次的任务泛化中提供了互补的优势。 在本工作中,我们提出了FOUNDER,一种将FMs中嵌入的可泛化知识与WMs的动态建模能力相结合的框架,以在无奖励的情况下实现具身环境中的开放式任务求解。 我们学习一个映射函数,将FM表示接地到WM状态空间中,从而从外部观察中有效推断出代理在世界模拟器中的物理状态。 这种映射使得在行为学习过程中通过想象学习一个目标条件策略成为可能,其中映射后的任务作为目标状态。 我们的方法利用预测的目标状态的时间距离作为有信息量的奖励信号。 FOUNDER在各种多任务离线视觉控制基准测试中表现出色,特别是在捕捉由文本或视频指定的任务的深层语义方面表现突出,尤其是在涉及复杂观察或领域差距的场景中,先前的方法难以应对。 我们的学习奖励函数与真实奖励的一致性也通过实验得到了验证。 我们的项目网站是https://sites.google.com/view/founder-rl。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.