Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > cs > arXiv:2410.13812

帮助 | 高级搜索

计算机科学 > 信息论

arXiv:2410.13812 (cs)
[提交于 2024年10月17日 (v1) ,最后修订 2025年7月24日 (此版本, v2)]

标题: 私有反事实检索

标题: Private Counterfactual Retrieval

Authors:Mohamed Nomeir, Pasan Dissanayake, Shreya Meel, Sanghamitra Dutta, Sennur Ulukus
摘要: 透明性和可解释性是在高风险应用中使用黑盒机器学习模型时需要考虑的两个极其重要的方面。 提供反事实解释是满足这一要求的一种方式。 然而,这也对提供解释的机构以及请求解释的用户的隐私构成威胁。 在本工作中,我们提出了多种受私有信息检索(PIR)技术启发的方案,以确保在检索反事实解释时的\emph{用户隐私}。 我们提出了一种方案,可以从接受点的数据库中检索出\emph{精确的}最近邻的反事实解释,同时为用户实现完美的(信息论意义上的)隐私。 虽然该方案为用户实现了完美的隐私,但数据库上的某些泄露是不可避免的,我们使用基于互信息的度量来量化这种泄露。 此外,我们提出了减少这种泄露的策略,以实现更高程度的数据库隐私。 我们将这些方案扩展以纳入用户对其属性转换的偏好,从而获得更具操作性的解释。 由于我们的方案依赖于有限域算术,我们在真实数据集上对方案进行了实证验证,以了解准确性和有限域大小之间的权衡。 最后,我们展示了数值结果以支持我们的理论发现,并比较了所提方案的数据库泄露情况。
摘要: Transparency and explainability are two extremely important aspects to be considered when employing black-box machine learning models in high-stake applications. Providing counterfactual explanations is one way of fulfilling this requirement. However, this also poses a threat to the privacy of both the institution that is providing the explanation as well as the user who is requesting it. In this work, we propose multiple schemes inspired by private information retrieval (PIR) techniques which ensure the \emph{user's privacy} when retrieving counterfactual explanations. We present a scheme which retrieves the \emph{exact} nearest neighbor counterfactual explanation from a database of accepted points while achieving perfect (information-theoretic) privacy for the user. While the scheme achieves perfect privacy for the user, some leakage on the database is inevitable which we quantify using a mutual information based metric. Furthermore, we propose strategies to reduce this leakage to achieve an advanced degree of database privacy. We extend these schemes to incorporate user's preference on transforming their attributes, so that a more actionable explanation can be received. Since our schemes rely on finite field arithmetic, we empirically validate our schemes on real datasets to understand the trade-off between the accuracy and the finite field sizes. Finally, we present numerical results to support our theoretical findings, and compare the database leakage of the proposed schemes.
主题: 信息论 (cs.IT) ; 密码学与安全 (cs.CR); 机器学习 (cs.LG); 信号处理 (eess.SP)
引用方式: arXiv:2410.13812 [cs.IT]
  (或者 arXiv:2410.13812v2 [cs.IT] 对于此版本)
  https://doi.org/10.48550/arXiv.2410.13812
通过 DataCite 发表的 arXiv DOI

提交历史

来自: Mohamed Nomeir [查看电子邮件]
[v1] 星期四, 2024 年 10 月 17 日 17:45:07 UTC (223 KB)
[v2] 星期四, 2025 年 7 月 24 日 17:25:40 UTC (150 KB)
全文链接:

获取论文:

    查看标题为《》的 PDF
  • 查看中文 PDF
  • 查看 PDF
  • HTML(实验性)
  • TeX 源代码
  • 其他格式
查看许可
当前浏览上下文:
cs.LG
< 上一篇   |   下一篇 >
新的 | 最近的 | 2024-10
切换浏览方式为:
cs
cs.CR
cs.IT
eess
eess.SP
math
math.IT

参考文献与引用

  • NASA ADS
  • 谷歌学术搜索
  • 语义学者
a 导出 BibTeX 引用 加载中...

BibTeX 格式的引用

×
数据由提供:

收藏

BibSonomy logo Reddit logo

文献和引用工具

文献资源探索 (什么是资源探索?)
连接的论文 (什么是连接的论文?)
Litmaps (什么是 Litmaps?)
scite 智能引用 (什么是智能引用?)

与本文相关的代码,数据和媒体

alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)

演示

复制 (什么是复制?)
Hugging Face Spaces (什么是 Spaces?)
TXYZ.AI (什么是 TXYZ.AI?)

推荐器和搜索工具

影响之花 (什么是影响之花?)
核心推荐器 (什么是核心?)
IArxiv 推荐器 (什么是 IArxiv?)
  • 作者
  • 地点
  • 机构
  • 主题

arXivLabs:与社区合作伙伴的实验项目

arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。

与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。

有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.

这篇论文的哪些作者是支持者? | 禁用 MathJax (什么是 MathJax?)
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号