统计学 > 方法论
[提交于 2025年7月7日
]
标题: 盲目标定:第三方隐私约束下的个性化
标题: Blind Targeting: Personalization under Third-Party Privacy Constraints
摘要: 主要广告平台最近通过限制广告商对个体级数据的访问来增加隐私保护。 而不是提供对细粒度原始数据的访问,这些平台只允许对数据集进行有限数量的聚合查询,并通过添加差分隐私噪声进一步保护数据。 本文研究了广告商在这些限制性的隐私保护数据环境中能否以及如何设计有效的定位策略。 为了实现这一目标,我开发了一种基于贝叶斯优化的概率机器学习方法,该方法有助于动态数据探索。 由于贝叶斯优化是设计用来从函数中采样点以找到其最大值的,因此它不适用于聚合查询和定位。 因此,我引入了两项创新:(i) 后验的积分更新,这使得可以选择最佳的数据区域进行查询,而不是单个点;(ii) 一种面向定位的获取函数,可以动态选择对定位任务最有信息量的区域。 我确定了数据集和隐私环境的条件,这些条件需要使用这种“智能”查询策略。 我将这种战略查询方法应用于Criteo AI Labs的提升建模数据集(Diemert等,2018),该数据集包含来自14M用户的访问和转化数据。 我表明,在某些情况下,一个直观的基准策略仅能实现非隐私保护定位潜力的33%,而我的战略查询方法实现了该潜力的97-101%,并且在统计上与因果森林(Athey等,2019)无法区分:这是一种最先进的非隐私保护机器学习定位方法。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.