计算机科学 > 人工智能
[提交于 2024年6月10日
]
标题: EXPIL:游戏学习中的解释性谓词发明
标题: EXPIL: Explanatory Predicate Invention for Learning in Games
摘要: 强化学习(RL)已被证明是训练在各种游戏中表现出色的智能体的强大工具。 然而,神经网络模型的黑箱特性常常阻碍我们理解智能体行为背后的推理过程。 最近的研究尝试通过使用预训练神经智能体的指导来编码基于逻辑的策略,从而实现可解释的决策。 此类方法的一个缺点是需要以谓词形式提供大量预先定义的背景知识,这限制了其适用性和可扩展性。 在本工作中,我们提出了一种新方法,游戏中的解释性谓词发明(EXPLANATORY PREDICATE INVENTION FOR LEARNING IN GAMES,EXPIL),该方法从预训练的神经智能体中识别和提取谓词,随后用于基于逻辑的智能体,从而减少对预先定义的背景知识的依赖。 我们在各种游戏中进行的实验评估表明,EXPIL在实现逻辑智能体的可解释行为的同时,所需背景知识更少。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.