计算机科学 > 密码学与安全
[提交于 2025年1月9日
]
标题: SpaLLM-Guard:使用开源和商业大语言模型进行短信垃圾邮件检测
标题: SpaLLM-Guard: Pairing SMS Spam Detection Using Open-source and Commercial LLMs
摘要: 日益增长的短信垃圾信息威胁,由不断演变的对抗技术和概念漂移驱动,需要更加稳健和自适应的检测方法。 在本文中,我们评估了大型语言模型(LLMs)在短信垃圾信息检测中的潜力,比较了它们在零样本、少量样本、微调和思维链提示方法上的性能。 使用一个全面的短信消息数据集,我们评估了GPT-4、DeepSeek、LLAMA-2和Mixtral等知名LLMs的垃圾信息检测能力。 我们的研究结果表明,尽管零样本学习提供了便利性,但它对于有效的垃圾信息检测不可靠。 少量样本学习,特别是通过精心选择的示例,可以提高检测效果,但不同模型之间表现出一定的差异性。 微调成为最有效的策略,Mixtral达到了98.6%的准确率,并且误报率和漏报率均低于2%,符合稳健垃圾信息检测的标准。 此外,我们探讨了这些模型对对抗攻击的鲁棒性,发现微调显著提高了对可见和不可见篡改的鲁棒性。 最后,我们研究了概念漂移的影响,并证明微调的LLMs,尤其是结合少量样本学习时,可以减轻其影响,在不断演变的垃圾信息数据集上仍能保持高性能。 本研究强调了微调和定制化学习策略的重要性,以有效部署LLMs进行现实世界的短信垃圾信息检测。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.