计算机科学 > 计算机视觉与模式识别
[提交于 2025年6月24日
(v1)
,最后修订 2025年6月25日 (此版本, v2)]
标题: 一个原型就足够了:用于可解释图像分类的单原型激活
标题: One Prototype Is Enough: Single-Prototype Activation for Interpretable Image Classification
摘要: 在本文中,我们提出ProtoSolo,一种新颖的深度神经架构,用于可解释的图像分类,其灵感来自于原型网络,如ProtoPNet。现有的原型网络通常依赖于多个原型的协作决策来实现单个类别的分类和解释。相比之下,ProtoSolo只需激活一个原型即可完成分类。这使得网络可以通过仅提供与该类别原型最相似的特征来解释每个类别决策,显著降低了解释的认知复杂度。其次,我们提出了一种基于特征的比较方法,该方法使用特征图而不是全通道特征向量作为相似性比较和原型学习的对象。这种设计使ProtoSolo能够在仅依赖单个原型激活的情况下利用更丰富的全局信息进行分类。此外,我们提出了一种非原型投影学习策略,在保留原型与训练图像块之间信息关联的同时,避免了投影操作引起的网络结构剧烈变化,从而避免了其对分类性能的负面影响。在CUB-200-2011和Stanford Cars数据集上的实验表明,ProtoSolo在分类任务中表现出色,并且在解释的认知复杂度方面达到了最先进的可解释方法的最佳水平。代码可在https://github.com/pyt19/ProtoSolo获取。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.