计算机科学 > 机器学习
[提交于 2025年7月11日
]
标题: ADAPT:一种对抗恶意软件检测中概念漂移的伪标签方法
标题: ADAPT: A Pseudo-labeling Approach to Combat Concept Drift in Malware Detection
摘要: 机器学习模型常用于恶意软件分类;然而,由于概念漂移,它们随时间推移会出现性能下降。 将这些模型适应变化的数据分布需要频繁更新,这依赖于成本高昂的地面真实标注。 虽然主动学习可以减少标注负担,但在恶意软件检测的背景下,通过半监督学习利用未标记数据的方法仍相对研究不足。 在本研究中,我们引入了\texttt{自适应},一种新的伪标签半监督算法,用于解决概念漂移问题。 我们的模型无关方法可以应用于各种机器学习模型,包括神经网络和基于树的算法。 我们在五个涵盖 Android、Windows 和 PDF 领域的多样化恶意软件检测数据集上进行了广泛实验。 结果表明,我们的方法始终优于基线模型和竞争性基准。 这项工作为在恶意软件检测中更有效地适应概念漂移的机器学习模型铺平了道路。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.