Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > cs > arXiv:2504.01481

帮助 | 高级搜索

计算机科学 > 密码学与安全

arXiv:2504.01481 (cs)
[提交于 2025年4月2日 ]

标题: 通过基于图的二进制代码语义分析识别伪装代码

标题: Identifying Obfuscated Code through Graph-Based Semantic Analysis of Binary Code

Authors:Roxane Cohen (LAMSADE), Robin David, Florian Yger (LITIS), Fabrice Rossi (CEREMADE)
摘要: 保护敏感程序内容在各种情况下都是一个关键问题,从合法的使用场景到不道德的情境皆是如此。 混淆是一种最常用的技术,以确保此类保护。 因此,攻击者必须首先检测和分析混淆,然后才能发起针对混淆的攻击。 本文研究了基于图的方法在函数级混淆检测中的问题,并比较了从基础算法到诸如GNN(图神经网络)等有前景技术的不同特征选择下的算法。 我们考虑了多种混淆类型和混淆器,从而生成了两个复杂的数据集。 我们的研究结果表明,为了超越基线模型,GNN需要有意义的特征来捕捉函数语义方面的信息。 我们的方法在具有挑战性的11类分类任务以及实际恶意软件分析示例中表现出了令人满意的结果。
摘要: Protecting sensitive program content is a critical issue in various situations, ranging from legitimate use cases to unethical contexts. Obfuscation is one of the most used techniques to ensure such protection. Consequently, attackers must first detect and characterize obfuscation before launching any attack against it. This paper investigates the problem of function-level obfuscation detection using graph-based approaches, comparing algorithms, from elementary baselines to promising techniques like GNN (Graph Neural Networks), on different feature choices. We consider various obfuscation types and obfuscators, resulting in two complex datasets. Our findings demonstrate that GNNs need meaningful features that capture aspects of function semantics to outperform baselines. Our approach shows satisfactory results, especially in a challenging 11-class classification task and in a practical malware analysis example.
评论: 第十三届国际复杂网络及其应用会议,2024年12月,土耳其伊斯坦布尔
主题: 密码学与安全 (cs.CR) ; 机器学习 (cs.LG); 机器学习 (stat.ML)
引用方式: arXiv:2504.01481 [cs.CR]
  (或者 arXiv:2504.01481v1 [cs.CR] 对于此版本)
  https://doi.org/10.48550/arXiv.2504.01481
通过 DataCite 发表的 arXiv DOI

提交历史

来自: Fabrice Rossi [查看电子邮件]
[v1] 星期三, 2025 年 4 月 2 日 08:36:27 UTC (57 KB)
全文链接:

获取论文:

    查看标题为《》的 PDF
  • 查看中文 PDF
  • 查看 PDF
  • TeX 源代码
  • 其他格式
查看许可
当前浏览上下文:
cs.CR
< 上一篇   |   下一篇 >
新的 | 最近的 | 2025-04
切换浏览方式为:
cs
cs.LG
stat
stat.ML

参考文献与引用

  • NASA ADS
  • 谷歌学术搜索
  • 语义学者
a 导出 BibTeX 引用 加载中...

BibTeX 格式的引用

×
数据由提供:

收藏

BibSonomy logo Reddit logo

文献和引用工具

文献资源探索 (什么是资源探索?)
连接的论文 (什么是连接的论文?)
Litmaps (什么是 Litmaps?)
scite 智能引用 (什么是智能引用?)

与本文相关的代码,数据和媒体

alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)

演示

复制 (什么是复制?)
Hugging Face Spaces (什么是 Spaces?)
TXYZ.AI (什么是 TXYZ.AI?)

推荐器和搜索工具

影响之花 (什么是影响之花?)
核心推荐器 (什么是核心?)
IArxiv 推荐器 (什么是 IArxiv?)
  • 作者
  • 地点
  • 机构
  • 主题

arXivLabs:与社区合作伙伴的实验项目

arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。

与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。

有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.

这篇论文的哪些作者是支持者? | 禁用 MathJax (什么是 MathJax?)
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号