计算机科学 > 声音
[提交于 2025年8月4日
(v1)
,最后修订 2025年8月5日 (此版本, v2)]
标题: 隐藏在噪声中:通过潜在声学模式触发器揭示音频大语言模型对齐中的后门
标题: Hidden in the Noise: Unveiling Backdoors in Audio LLMs Alignment through Latent Acoustic Pattern Triggers
摘要: 随着音频大型语言模型(ALLMs)成为语音处理的强大工具,其安全影响亟需关注。 尽管已有大量研究探索了文本和视觉安全,但音频的独特特性带来了重大挑战。 本文首先进行如下研究: ALLM是否容易受到利用声学触发器的后门攻击? 针对这一问题,我们引入了隐藏在噪声中的(HIN),这是一种新颖的后门攻击框架,旨在利用细微的、音频特有的特征。 HIN对原始音频波形进行声学修改,例如时间动态的改变和有策略地注入频谱定制的噪声。 这些变化会引入一致的模式,ALLM的声学特征编码器会捕捉到这些模式,在音频流中嵌入强大的触发器。 为了评估ALLM对基于音频特征的触发器的鲁棒性,我们开发了AudioSafe基准测试,评估九种不同的风险类型。 在AudioSafe和三个已建立的安全数据集上的广泛实验揭示了现有ALLMs中的关键漏洞:(I)如环境噪声和语音速率变化等音频特征平均攻击成功率超过90%。(II)ALLM在不同声学特征上表现出显著的敏感性差异,特别是对音量作为触发器的响应最小,(III)中毒样本的包含仅导致损失曲线的微小波动,突显了攻击的隐蔽性。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.