计算机科学 > 密码学与安全
[提交于 2025年7月14日
]
标题: 3S攻击:针对DNN模型的空间、频谱和语义不可见后门攻击
标题: 3S-Attack: Spatial, Spectral and Semantic Invisible Backdoor Attack Against DNN Models
摘要: 后门攻击涉及污染训练数据或直接修改模型,以植入一种隐藏行为,当存在特定触发器时会导致模型对输入进行错误分类。 在推理过程中,模型对良性样本保持高准确性,但会将被污染的样本错误分类为攻击者指定的目标类别。 现有的后门攻击研究探索了在空间、光谱(频率)和语义(特征)领域开发触发器,旨在使其隐蔽。 虽然一些方法考虑了在空间和光谱领域都难以察觉的触发器,但很少有方法结合了语义领域。 在本文中,我们提出了一种新颖的后门攻击,称为3S-攻击,它在空间、光谱和语义领域都是隐蔽的。 其核心思想是利用良性样本的语义特征作为触发器,使用梯度加权类激活映射(Grad-CAM)和一个预训练模型进行提取。 然后将触发器嵌入到光谱领域,在将样本转换回空间领域后,再进行像素级限制。 这一过程最小化了被污染样本和良性样本之间的距离,使攻击更难被现有防御措施和人工检查发现。 在各种数据集上的大量实验以及理论分析表明了3S-攻击的隐蔽性,并强调了需要更强的防御措施以确保人工智能安全。 我们的代码可在以下网址获取:https://anonymous.4open.science/r/anon-project-3776/
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.