计算机科学 > 计算机视觉与模式识别
[提交于 2025年5月31日
]
标题: 具有扩散模型的鲁棒视觉跟踪的有效且高效的对抗防御研究
标题: Towards Effective and Efficient Adversarial Defense with Diffusion Models for Robust Visual Tracking
摘要: 尽管基于深度学习的视觉跟踪方法取得了显著进展,但在面对精心设计的对抗性攻击时表现出脆弱性,这可能导致跟踪性能急剧下降。 为了解决这一问题,本文首次提出了一种新颖的基于去噪扩散概率模型的对抗防御方法,称为DiffDf,旨在有效提高现有视觉跟踪方法对对抗性攻击的鲁棒性。 DiffDf通过结合像素级重建损失、语义一致性损失和结构相似性损失,建立了多尺度防御机制,在渐进去噪过程中有效地抑制了对抗扰动。 在多个主流数据集上的广泛实验结果表明,DiffDf方法对具有不同架构的跟踪器表现出优异的泛化性能,显著提升了各种评估指标,同时实现了超过30 FPS的实时推理速度,展示了出色的防御性能和效率。 代码可在https://github.com/pgao-lab/DiffDf获取。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.