Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > cs > arXiv:2406.15613v1

帮助 | 高级搜索

计算机科学 > 机器学习

arXiv:2406.15613v1 (cs)
[提交于 2024年6月21日 ]

标题: 登山者:用于比较局部解释的拓扑驱动可视化分析

标题: MOUNTAINEER: Topology-Driven Visual Analytics for Comparing Local Explanations

Authors:Parikshit Solunke, Vitoria Guardieiro, Joao Rulff, Peter Xenopoulos, Gromit Yeuk-Yin Chan, Brian Barr, Luis Gustavo Nonato, Claudio Silva
摘要: 随着黑盒机器学习(ML)技术在关键应用中的日益普及,对于能够为模型预测提供透明度和问责制的方法的需求也在不断增加。 因此,已经开发并推广了许多针对黑盒模型的局部可解释性方法。 然而,由于这些方法的高维性、异构表示、不同尺度以及随机性质,机器学习解释仍然难以评估和比较。 拓扑数据分析(TDA)在此领域可能是一种有效的方法,因为它可以将属性转换为统一的图表示,为不同解释方法之间的比较提供一个共同的基础。 我们提出了一种新颖的拓扑驱动的可视化分析工具Mountaineer,它允许ML从业者通过将拓扑图与原始数据分布、模型预测和特征属性联系起来,以交互方式分析和比较这些表示。 Mountaineer促进了ML解释的快速和迭代探索,使专家能够更深入地了解解释技术,理解底层的数据分布,从而对模型行为得出有根据的结论。 此外,我们通过两个使用真实世界数据的案例研究展示了Mountaineer的实用性。 在第一个案例中,我们展示了Mountaineer如何帮助我们比较黑盒ML解释,并识别不同解释之间分歧的区域和原因。 在第二个案例中,我们演示了该工具如何用于比较和理解ML模型本身。 最后,我们采访了三位行业专家,以帮助我们评估我们的工作。
摘要: With the increasing use of black-box Machine Learning (ML) techniques in critical applications, there is a growing demand for methods that can provide transparency and accountability for model predictions. As a result, a large number of local explainability methods for black-box models have been developed and popularized. However, machine learning explanations are still hard to evaluate and compare due to the high dimensionality, heterogeneous representations, varying scales, and stochastic nature of some of these methods. Topological Data Analysis (TDA) can be an effective method in this domain since it can be used to transform attributions into uniform graph representations, providing a common ground for comparison across different explanation methods. We present a novel topology-driven visual analytics tool, Mountaineer, that allows ML practitioners to interactively analyze and compare these representations by linking the topological graphs back to the original data distribution, model predictions, and feature attributions. Mountaineer facilitates rapid and iterative exploration of ML explanations, enabling experts to gain deeper insights into the explanation techniques, understand the underlying data distributions, and thus reach well-founded conclusions about model behavior. Furthermore, we demonstrate the utility of Mountaineer through two case studies using real-world data. In the first, we show how Mountaineer enabled us to compare black-box ML explanations and discern regions of and causes of disagreements between different explanations. In the second, we demonstrate how the tool can be used to compare and understand ML models themselves. Finally, we conducted interviews with three industry experts to help us evaluate our work.
评论: 文章的作者版本已被接受至IEEE Transactions on 可视化和计算机图形学
主题: 机器学习 (cs.LG) ; 图形学 (cs.GR); 代数拓扑 (math.AT)
引用方式: arXiv:2406.15613 [cs.LG]
  (或者 arXiv:2406.15613v1 [cs.LG] 对于此版本)
  https://doi.org/10.48550/arXiv.2406.15613
通过 DataCite 发表的 arXiv DOI

提交历史

来自: Parikshit Solunke [查看电子邮件]
[v1] 星期五, 2024 年 6 月 21 日 19:28:50 UTC (9,201 KB)
全文链接:

获取论文:

    查看标题为《》的 PDF
  • 查看中文 PDF
  • 查看 PDF
  • HTML(实验性)
  • TeX 源代码
  • 其他格式
查看许可
当前浏览上下文:
cs.LG
< 上一篇   |   下一篇 >
新的 | 最近的 | 2024-06
切换浏览方式为:
cs
cs.GR
math
math.AT

参考文献与引用

  • NASA ADS
  • 谷歌学术搜索
  • 语义学者
a 导出 BibTeX 引用 加载中...

BibTeX 格式的引用

×
数据由提供:

收藏

BibSonomy logo Reddit logo

文献和引用工具

文献资源探索 (什么是资源探索?)
连接的论文 (什么是连接的论文?)
Litmaps (什么是 Litmaps?)
scite 智能引用 (什么是智能引用?)

与本文相关的代码,数据和媒体

alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)

演示

复制 (什么是复制?)
Hugging Face Spaces (什么是 Spaces?)
TXYZ.AI (什么是 TXYZ.AI?)

推荐器和搜索工具

影响之花 (什么是影响之花?)
核心推荐器 (什么是核心?)
IArxiv 推荐器 (什么是 IArxiv?)
  • 作者
  • 地点
  • 机构
  • 主题

arXivLabs:与社区合作伙伴的实验项目

arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。

与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。

有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.

这篇论文的哪些作者是支持者? | 禁用 MathJax (什么是 MathJax?)
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号