计算机科学 > 人工智能
[提交于 2024年6月3日
]
标题: 通过时间对比学习的多智能体迁移学习
标题: Multi-Agent Transfer Learning via Temporal Contrastive Learning
摘要: 本文介绍了一种用于深度多智能体强化学习的新型迁移学习框架。 该方法自动将目标条件策略与时间对比学习相结合,以发现有意义的子目标。 该方法包括预训练一个目标条件智能体,在目标领域进行微调,并使用对比学习构建一个通过子目标引导智能体的规划图。 在多智能体协作的Overcooked任务上的实验表明,相比基线方法,该方法提高了样本效率,能够解决稀疏奖励和长视野问题,并增强了可解释性。 结果突显了将目标条件策略与无监督时间抽象学习相结合在复杂多智能体迁移学习中的有效性。 与最先进的基线方法相比,我们的方法在仅需21.7%训练样本的情况下实现了相同或更好的性能。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.