物理学 > 物理与社会
[提交于 2018年3月14日
]
标题: 去除游戏统计中的技能偏差
标题: Removing Skill Bias from Gaming Statistics
摘要: “给定某个走法的获胜机会”是从数据中轻易获得的量,并且经常出现在游戏统计数据中。 这也是强化学习人工智能所基于的基本量。 不幸的是,这个条件概率可能会产生误导。 除非所有玩家的水平都相等,否则这个数字并不能告诉我们该走法的内在价值。 这是因为以一个好走法为条件,也必然会选出一些更好的玩家子集。 他们倾向于做出其他好走法,这也导致了额外的获胜机会。 我们提出一个简单的玩具模型来量化这种“技能偏差”效应,然后提出一种通用的方法来消除它。 我们的方法是模块化的、可推广的,并且只需要从数据中获取容易获得的量。 特别是,无论数据来自一组好玩家还是坏玩家,我们的方法都会得出相同的答案。 这可能有助于我们最终摆脱“向专家学习”的传统智慧,避免陷入群体思维的陷阱。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.