计算机科学 > 网络与互联网架构
[提交于 2025年1月8日
]
标题: 面向漂移的自演化加密流量应用分类方法在实际网络环境中的应用
标题: Drift-oriented Self-evolving Encrypted Traffic Application Classification for Actual Network Environment
摘要: 加密流量分类技术是网络管理和安全防护中的关键决策信息来源。 它具有响应及时性优秀、大规模数据承载和跨时空分析等优势。 现有的加密流量分类研究已逐渐从封闭世界转向开放世界,提出了许多分类器优化和特征工程方案。 然而,加密流量分类尚未能有效应用于实际网络环境。 主要原因在于互联网上的应用程序不断更新,包括功能调整和版本变化,这带来了严重的特征概念漂移,导致分类器迅速失效。 因此,整个模型必须在非常短的时间内重新训练,而带有标记样本的构建和模型训练成本是不可接受的。 为了解决这个问题,我们深入研究了互联网应用更新的特性,将其与特征概念漂移相关联,然后提出了自进化加密流量分类方法。 我们提出了一种特征概念漂移确定方法和一种基于Laida准则的面向漂移的自进化微调方法,以适应所有可能更新的应用。 在没有精确标记样本的情况下,分类器通过持续的完全微调进行进化,两次必要重新训练之间的时间间隔大大延长,从而可以应用于实际网络环境。 实验表明,我们的方法在后续月份的后续阶段数据集上显著提高了原始分类器的分类性能(F1分数提高了9%),而无需任何难以获取的标记样本。 在当前的实验环境下,分类器的寿命延长到了八个月以上。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.