计算机科学 > 计算机科学与博弈论
[提交于 2024年8月1日
]
标题: 逆时针耗散性、势博弈与进化纳什均衡学习
标题: Counterclockwise Dissipativity, Potential Games and Evolutionary Nash Equilibrium Learning
摘要: 我们使用系统理论的无源性方法来研究大规模参与战略非合作互动的代理群体中的进化纳什均衡学习。 代理遵循学习规则(简称规则)来体现其战略偏好,收益机制为可用策略分配收益。 群体的整体战略配置是相关进化动力系统的状态。 进化纳什均衡学习指的是该状态收敛到收益机制的纳什均衡集。 大多数方法考虑无记忆收益机制,例如势博弈。 最近,使用$\delta$-无源性和平衡独立无源性(EIP)的方法引入了动态收益机制。 然而,当代理遵循表现出“模仿”行为的规则时,如复制者动力学中那样,$\delta$-无源性不成立。 相反,EIP适用于复制者动力学,但不适用于$\delta$-无源规则。 我们使用逆时针耗散性(CCW)来填补这一空白。 首先,我们证明连续无记忆收益机制是 CCW 的当且仅当它们是势博弈。 随后,在(可能动态的)CCW 收益机制下,我们为由模仿规则和连续$\delta$-无源规则张成的凸锥内的任何规则建立进化纳什均衡学习。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.