计算机科学 > 机器学习
[提交于 2025年6月30日
]
标题: 扩散和自回归图像生成模型中的放射性水印
标题: Radioactive Watermarks in Diffusion and Autoregressive Image Generative Models
摘要: 生成模型在图像生成领域变得越来越流行,但训练它们需要大量数据集,而收集和整理这些数据集的成本很高。 为了规避这些成本,一些方可能会通过使用生成的图像作为他们自己模型的训练数据来利用现有的模型。 一般来说,水印是一种检测生成图像未经授权使用的有价值工具。 然而,当这些图像被用于训练新模型时,只有当水印在训练过程中保持不变,并且在新训练模型的输出中仍可识别时,水印才能实现检测——这一特性被称为放射性。 我们分析了扩散模型(DMs)和图像自回归模型(IARs)生成图像中的水印的放射性。 我们发现现有的DMs水印方法无法保持放射性,因为水印在编码到潜在空间的过程中被擦除,或者在噪声-去噪过程中丢失(在潜在空间中的训练过程中)。 同时,尽管IARs最近在图像生成质量和效率方面超过了DMs,但尚未有针对IARs的放射性水印方法被提出。 为克服这一限制,我们提出了第一个专为IARs设计并考虑放射性的水印方法——从大型语言模型(LLMs)中的技术获得灵感,这些模型与IARs具有相同的自回归范式。 我们的广泛实验评估突显了我们方法在IARs中保持放射性的有效性,实现了强大的来源追踪,并防止了其生成图像的未经授权使用。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.