电气工程与系统科学 > 系统与控制
[提交于 2025年6月2日
]
标题: 可解释的热泵控制强化学习通过非对称可微决策树
标题: Interpretable reinforcement learning for heat pump control through asymmetric differentiable decision trees
摘要: 近年来,深度强化学习(DRL)算法在家庭能源管理系统中引起了广泛关注。然而,由于DRL的黑箱性质,未能提供透明的决策反馈,能源管理公司对其采用仍受到限制。为了解决这一问题,可解释强化学习(XRL)技术应运而生,旨在使DRL决策更加透明。在这其中,软微分决策树(DDT)蒸馏提供了一种有前景的方法,因为它们基于清晰的决策规则,可以高效计算。 然而,实现高性能通常需要构建深度且完全满的树,这降低了可解释性。为了解决这个问题,我们提出了一种新颖的非对称软DDT构造方法。与传统的软DDT不同,我们的方法通过仅在必要时扩展节点来自适应地构建树。这种方法提高了决策节点的有效利用,这些节点需要预先确定的深度来构建完整的对称树,从而同时提升了可解释性和性能。 我们展示了非对称DDT在家庭能源管理系统中提供透明、高效和高性能决策的潜力。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.