计算机科学 > 密码学与安全
[提交于 2025年1月8日
]
标题: 探索大型语言模型用于安卓恶意软件的语义分析和分类
标题: Exploring Large Language Models for Semantic Analysis and Categorization of Android Malware
摘要: 恶意软件分析是一个复杂的流程,涉及对恶意软件的功能、来源和潜在影响进行检查和评估。 这个艰难的流程通常包括分解软件以了解其组件、感染途径、传播机制和负载。 多年来,对恶意软件的深度逆向工程变得越来越繁琐,主要是由于现代恶意代码库的快速演变和复杂性。 本质上,分析人员的任务是在零日恶意软件的复杂性中找到隐藏的针尖,同时在严格的时间限制下完成。 因此,在本文中,我们探讨利用大型语言模型(LLMs)进行语义恶意软件分析,以加快已知和新型样本的分析。 基于GPT-4o-mini模型,\msp 旨在通过分层摘要链和策略性提示工程来增强Android平台的恶意软件分析。 此外,\msp 执行恶意软件分类,区分潜在恶意软件和良性应用程序,从而在恶意软件逆向工程过程中节省时间。 尽管未针对Android恶意软件分析进行微调,但我们证明,通过优化和先进的提示工程,\msp 可以达到高达77%的分类准确率,同时在功能、类别和包级别提供高度稳健的摘要。 此外,利用从包级别到功能级别的摘要反向追踪,使我们能够精确定位导致恶意行为的代码片段。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.