Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > stat > arXiv:2507.12497

帮助 | 高级搜索

统计学 > 方法论

arXiv:2507.12497 (stat)
[提交于 2025年7月15日 ]

标题: 通过分位数二分查找的差分隐私共形预测

标题: Differentially Private Conformal Prediction via Quantile Binary Search

Authors:Ogonnaya M. Romanus, Roberto Molinari
摘要: 大多数差分隐私(DP)方法侧重于限制学习者在基于其训练数据时的隐私泄露,而较少有方法考虑在涉及校准数据集的程序中可能出现的泄露,这在不确定性量化方法(如合规预测(CP))中很常见。 由于这一方向上的方法有限,我们在本工作中提出了一种通用的DP方法用于CP,我们称之为通过分位数搜索的私有合规性(P-COQS)。 所提出的方法适应了一种现有的随机二分搜索算法,用于在CP的校准阶段计算DP分位数,从而保证后续预测集的隐私性。 然而,这会带来一定的代价,即在使用有限样本校准集时,相对于所需的$(1 - \alpha)$-水平略有覆盖不足(尽管广泛的实证结果表明,P-COQS在所考虑的情况下通常能实现所需水平)。 为了验证所适应算法的性质并量化后续CP的近似覆盖保证,我们进行了大量实验,以检查隐私噪声、样本大小和显著性水平对我们的方法相对于现有替代方法性能的影响。 此外,我们在几个基准数据集上对我们的方法进行了实证评估,包括CIFAR-10、ImageNet和CoronaHack。 我们的结果表明,所提出的方法对隐私噪声具有鲁棒性,并且在经验覆盖、效率和信息性方面相对于当前的DP替代方法表现更优。 具体而言,结果表明,在所有这些实验设置中,P-COQS能够生成更小的合规预测集,同时针对所需的覆盖水平和隐私保证。
摘要: Most Differentially Private (DP) approaches focus on limiting privacy leakage from learners based on the data that they are trained on, there are fewer approaches that consider leakage when procedures involve a calibration dataset which is common in uncertainty quantification methods such as Conformal Prediction (CP). Since there is a limited amount of approaches in this direction, in this work we deliver a general DP approach for CP that we call Private Conformity via Quantile Search (P-COQS). The proposed approach adapts an existing randomized binary search algorithm for computing DP quantiles in the calibration phase of CP thereby guaranteeing privacy of the consequent prediction sets. This however comes at a price of slightly under-covering with respect to the desired $(1 - \alpha)$-level when using finite-sample calibration sets (although broad empirical results show that the P-COQS generally targets the required level in the considered cases). Confirming properties of the adapted algorithm and quantifying the approximate coverage guarantees of the consequent CP, we conduct extensive experiments to examine the effects of privacy noise, sample size and significance level on the performance of our approach compared to existing alternatives. In addition, we empirically evaluate our approach on several benchmark datasets, including CIFAR-10, ImageNet and CoronaHack. Our results suggest that the proposed method is robust to privacy noise and performs favorably with respect to the current DP alternative in terms of empirical coverage, efficiency, and informativeness. Specifically, the results indicate that P-COQS produces smaller conformal prediction sets while simultaneously targeting the desired coverage and privacy guarantees in all these experimental settings.
主题: 方法论 (stat.ME) ; 机器学习 (cs.LG); 应用 (stat.AP); 计算 (stat.CO); 机器学习 (stat.ML)
引用方式: arXiv:2507.12497 [stat.ME]
  (或者 arXiv:2507.12497v1 [stat.ME] 对于此版本)
  https://doi.org/10.48550/arXiv.2507.12497
通过 DataCite 发表的 arXiv DOI

提交历史

来自: Roberto Molinari Mr [查看电子邮件]
[v1] 星期二, 2025 年 7 月 15 日 22:08:02 UTC (215 KB)
全文链接:

获取论文:

    查看标题为《》的 PDF
  • 查看中文 PDF
  • 查看 PDF
  • HTML(实验性)
  • TeX 源代码
  • 其他格式
许可图标 查看许可
当前浏览上下文:
cs
< 上一篇   |   下一篇 >
新的 | 最近的 | 2025-07
切换浏览方式为:
cs.LG
stat
stat.AP
stat.CO
stat.ME
stat.ML

参考文献与引用

  • NASA ADS
  • 谷歌学术搜索
  • 语义学者
a 导出 BibTeX 引用 加载中...

BibTeX 格式的引用

×
数据由提供:

收藏

BibSonomy logo Reddit logo

文献和引用工具

文献资源探索 (什么是资源探索?)
连接的论文 (什么是连接的论文?)
Litmaps (什么是 Litmaps?)
scite 智能引用 (什么是智能引用?)

与本文相关的代码,数据和媒体

alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)

演示

复制 (什么是复制?)
Hugging Face Spaces (什么是 Spaces?)
TXYZ.AI (什么是 TXYZ.AI?)

推荐器和搜索工具

影响之花 (什么是影响之花?)
核心推荐器 (什么是核心?)
IArxiv 推荐器 (什么是 IArxiv?)
  • 作者
  • 地点
  • 机构
  • 主题

arXivLabs:与社区合作伙伴的实验项目

arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。

与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。

有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.

这篇论文的哪些作者是支持者? | 禁用 MathJax (什么是 MathJax?)
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号