计算机科学 > 机器学习
[提交于 2025年7月5日
]
标题: 用于锐度感知最小化的数据 Attribution
标题: Attributing Data for Sharpness-Aware Minimization
摘要: 锐度感知最小化(SAM)通过将损失景观几何与泛化联系起来,提高了大规模模型训练的泛化能力。 然而,诸如标签错误的噪声数据和隐私问题等挑战已成为重大问题。 数据归因,即识别特定训练样本的贡献,提供了一个有前景的解决方案。 然而,直接将现有的数据影响评估工具如影响函数(IF)应用于SAM将是不可行或不准确的,因为SAM使用一个内部循环来寻找使损失最大化的模型扰动,然后外部循环对其进行最小化,导致计算结构加倍。 此外,这种双层结构使得对数据影响建模变得复杂。 在本文中,基于影响函数(IF),我们为SAM开发了两种创新的数据估值方法,在不同场景中各具独特优势:基于Hessian的影响函数和基于梯度轨迹的影响函数。 第一个方法使用仅依赖于训练后模型权重的闭式度量来全面估计数据影响。 相比之下,SAM的另一种影响函数利用训练期间的梯度轨迹信息进行更准确和高效的数据评估。 大量实验证明了它们在数据评估和参数调整中的有效性,应用包括识别标签错误的数据、模型编辑和增强可解释性。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.