计算机科学 > 机器学习
[提交于 2025年1月24日
]
标题: 在变化环境中的决策制定:鲁棒性、基于查询的学习和 differential privacy
标题: Decision Making in Changing Environments: Robustness, Query-Based Learning, and Differential Privacy
摘要: 我们研究了在随时间变化的环境中进行交互式决策的问题,该环境的变化受到给定约束条件的限制。 我们提出了一种框架,称为\textit{基于结构化观测的混合决策-making}(混合DMSO),它在决策的随机性和对抗性设定之间提供了插值。 在这个框架内,我们可以分析局部差分隐私(LDP)决策制定、基于查询的学习(特别是SQ学习)、以及在相同伞状结构下的鲁棒和平滑决策制定,基于决策-估计系数(DEC)的变体推导出上下界。 我们进一步建立了DEC的行为、SQ维数、局部最小极大复杂度、可学习性和联合差分隐私之间的强联系。 为了展示该框架的能力,我们在LDP约束下为上下文-bandit问题提供了新的结果。
当前浏览上下文:
cs.LG
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.