计算机科学 > 密码学与安全
[提交于 2025年7月15日
]
标题: MalCodeAI:通过语言无关代码推理实现自主漏洞检测和修复
标题: MalCodeAI: Autonomous Vulnerability Detection and Remediation via Language Agnostic Code Reasoning
摘要: 随着网络威胁的复杂性不断增加,以及传统漏洞检测工具的局限性,需要为保护软件系统采用新的方法。我们引入了MalCodeAI,这是一种语言无关的多阶段人工智能流程,用于自主代码安全分析和修复。MalCodeAI结合了代码分解和语义推理,使用经过微调的Qwen2.5-Coder-3B-Instruct模型,在MLX框架中通过低秩适应(LoRA)进行优化,并在14种编程语言中实现了可扩展且准确的结果。在第一阶段,经过200次迭代、6个可训练层和学习率为2 x 10^(-5)后,该模型在功能分解和代码片段摘要方面的验证损失低至0.397。在第二阶段,对于漏洞检测和修复,它使用相同次数的迭代和可训练层,但将学习率提高到4 x 10^(-5),达到了最佳验证损失0.199,有效地识别了安全缺陷并提出了可操作的修复建议。MalCodeAI支持红帽风格的利用追踪、基于CVSS的风险评分以及零样本泛化,以检测复杂的零日漏洞。在涉及15名开发者的定性评估中,该系统在有用性(平均8.06/10)、可解释性(平均7.40/10)和输出可读性(平均7.53/10)方面获得了高分,证实了其在实际开发工作流中的实用价值。这项工作标志着向智能、可解释和以开发人员为中心的软件安全解决方案迈出了重要一步。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.