计算机科学 > 机器学习
[提交于 2025年1月1日
(v1)
,最后修订 2025年6月5日 (此版本, v3)]
标题: 在虚假相关性存在的情况下揭示记忆效应
标题: Uncovering Memorization Effect in the Presence of Spurious Correlations
摘要: 机器学习模型常常依赖于简单的虚假特征——即训练数据中与目标相关联但与其无因果关系的模式,比如在前景分类中的图像背景。 这种依赖性通常会导致少数群体和多数群体之间的测试性能不平衡。 在这项工作中,我们通过记忆的视角更深入地研究了这种性能不平衡的根本原因,记忆指的是在训练集中准确预测非典型样本(少数群体)的能力,但在测试集中却无法达到相同的准确性。 本文系统地展示了网络中小部分神经元内普遍存在虚假特征,并提供了首个证据表明记忆可能有助于解释群体间性能的不平衡。 通过三个实验来源的汇聚实证证据,我们发现小部分神经元或通道具有记忆少数群体信息的特性。 受这些发现启发,我们假设虚假记忆,集中在少量神经元内,是导致群体间性能不平衡的关键因素。 为进一步验证这一假设,我们展示了通过一种新颖框架在训练过程中消除这些不必要的虚假记忆模式,可以显著影响模型在少数群体上的表现。 我们的实验结果涵盖多种架构和基准,为理解神经网络如何编码核心与虚假知识提供了新的见解,为未来研究如何破解虚假相关性的鲁棒性奠定了基础。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.