Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > cs > arXiv:2501.04246

帮助 | 高级搜索

计算机科学 > 网络与互联网架构

arXiv:2501.04246 (cs)
[提交于 2025年1月8日 ]

标题: 面向漂移的自演化加密流量应用分类方法在实际网络环境中的应用

标题: Drift-oriented Self-evolving Encrypted Traffic Application Classification for Actual Network Environment

Authors:Zihan Chen, Guang Cheng, Jinhui Li, Tian Qin, Yuyang Zhou, Xing Luan
摘要: 加密流量分类技术是网络管理和安全防护中的关键决策信息来源。 它具有响应及时性优秀、大规模数据承载和跨时空分析等优势。 现有的加密流量分类研究已逐渐从封闭世界转向开放世界,提出了许多分类器优化和特征工程方案。 然而,加密流量分类尚未能有效应用于实际网络环境。 主要原因在于互联网上的应用程序不断更新,包括功能调整和版本变化,这带来了严重的特征概念漂移,导致分类器迅速失效。 因此,整个模型必须在非常短的时间内重新训练,而带有标记样本的构建和模型训练成本是不可接受的。 为了解决这个问题,我们深入研究了互联网应用更新的特性,将其与特征概念漂移相关联,然后提出了自进化加密流量分类方法。 我们提出了一种特征概念漂移确定方法和一种基于Laida准则的面向漂移的自进化微调方法,以适应所有可能更新的应用。 在没有精确标记样本的情况下,分类器通过持续的完全微调进行进化,两次必要重新训练之间的时间间隔大大延长,从而可以应用于实际网络环境。 实验表明,我们的方法在后续月份的后续阶段数据集上显著提高了原始分类器的分类性能(F1分数提高了9%),而无需任何难以获取的标记样本。 在当前的实验环境下,分类器的寿命延长到了八个月以上。
摘要: Encrypted traffic classification technology is a crucial decision-making information source for network management and security protection. It has the advantages of excellent response timeliness, large-scale data bearing, and cross-time-and-space analysis. The existing research on encrypted traffic classification has gradually transitioned from the closed world to the open world, and many classifier optimization and feature engineering schemes have been proposed. However, encrypted traffic classification has yet to be effectively applied to the actual network environment. The main reason is that applications on the Internet are constantly updated, including function adjustment and version change, which brings severe feature concept drift, resulting in rapid failure of the classifier. Hence, the entire model must be retrained only past very fast time, with unacceptable labeled sample constructing and model training cost. To solve this problem, we deeply study the characteristics of Internet application updates, associate them with feature concept drift, and then propose self-evolving encrypted traffic classification. We propose a feature concept drift determination method and a drift-oriented self-evolving fine-tuning method based on the Laida criterion to adapt to all applications that are likely to be updated. In the case of no exact label samples, the classifier evolves through fully fine-tuning continuously, and the time interval between two necessary retraining is greatly extended to be applied to the actual network environment. Experiments show that our approach significantly improves the classification performance of the original classifier on the following stage dataset of the following months (9\% improvement on F1-score) without any hard-to-acquire labeled sample. Under the current experimental environment, the life of the classifier is extended to more than eight months.
主题: 网络与互联网架构 (cs.NI)
引用方式: arXiv:2501.04246 [cs.NI]
  (或者 arXiv:2501.04246v1 [cs.NI] 对于此版本)
  https://doi.org/10.48550/arXiv.2501.04246
通过 DataCite 发表的 arXiv DOI

提交历史

来自: Zihan Chen [查看电子邮件]
[v1] 星期三, 2025 年 1 月 8 日 03:10:30 UTC (1,431 KB)
全文链接:

获取论文:

    查看标题为《》的 PDF
  • 查看中文 PDF
  • 查看 PDF
  • HTML(实验性)
  • TeX 源代码
  • 其他格式
许可图标 查看许可
当前浏览上下文:
cs.NI
< 上一篇   |   下一篇 >
新的 | 最近的 | 2025-01
切换浏览方式为:
cs

参考文献与引用

  • NASA ADS
  • 谷歌学术搜索
  • 语义学者
a 导出 BibTeX 引用 加载中...

BibTeX 格式的引用

×
数据由提供:

收藏

BibSonomy logo Reddit logo

文献和引用工具

文献资源探索 (什么是资源探索?)
连接的论文 (什么是连接的论文?)
Litmaps (什么是 Litmaps?)
scite 智能引用 (什么是智能引用?)

与本文相关的代码,数据和媒体

alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)

演示

复制 (什么是复制?)
Hugging Face Spaces (什么是 Spaces?)
TXYZ.AI (什么是 TXYZ.AI?)

推荐器和搜索工具

影响之花 (什么是影响之花?)
核心推荐器 (什么是核心?)
IArxiv 推荐器 (什么是 IArxiv?)
  • 作者
  • 地点
  • 机构
  • 主题

arXivLabs:与社区合作伙伴的实验项目

arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。

与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。

有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.

这篇论文的哪些作者是支持者? | 禁用 MathJax (什么是 MathJax?)
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号