Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > cs > arXiv:2510.19420

帮助 | 高级搜索

计算机科学 > 密码学与安全

arXiv:2510.19420 (cs)
[提交于 2025年10月22日 ]

标题: 通过节点评估监控基于大语言模型的多智能体系统中的损坏情况

标题: Monitoring LLM-based Multi-Agent Systems Against Corruptions via Node Evaluation

Authors:Chengcan Wu, Zhixin Zhang, Mingqian Xu, Zeming Wei, Meng Sun
摘要: 基于大型语言模型(LLM)的多智能体系统(MAS)已成为人工智能应用的一种流行范式。 然而,MAS中的可信度问题仍然是一个关键关注点。 与单智能体系统中的挑战不同,MAS涉及更复杂的通信过程,使其容易受到腐蚀攻击。 为了缓解这一问题,已经开发了几种基于MAS图表示的防御机制,其中智能体代表节点,通信形成边。 然而,这些方法主要集中在静态图防御上,试图在固定图结构中检测攻击或优化具有特定防御能力的静态拓扑。 为了解决这一限制,我们提出了一种针对MAS图结构的动态防御范式,该范式持续监控MAS图中的通信,然后动态调整图拓扑,准确地破坏恶意通信,并有效防御不断演变和多样化的动态攻击。 在日益复杂和动态的MAS环境中进行的实验结果表明,我们的方法显著优于现有的MAS防御机制,为它们的可信应用提供了一个有效的保障措施。 我们的代码可在 https://github.com/ChengcanWu/Monitoring-LLM-Based-Multi-Agent-Systems 获取。
摘要: Large Language Model (LLM)-based Multi-Agent Systems (MAS) have become a popular paradigm of AI applications. However, trustworthiness issues in MAS remain a critical concern. Unlike challenges in single-agent systems, MAS involve more complex communication processes, making them susceptible to corruption attacks. To mitigate this issue, several defense mechanisms have been developed based on the graph representation of MAS, where agents represent nodes and communications form edges. Nevertheless, these methods predominantly focus on static graph defense, attempting to either detect attacks in a fixed graph structure or optimize a static topology with certain defensive capabilities. To address this limitation, we propose a dynamic defense paradigm for MAS graph structures, which continuously monitors communication within the MAS graph, then dynamically adjusts the graph topology, accurately disrupts malicious communications, and effectively defends against evolving and diverse dynamic attacks. Experimental results in increasingly complex and dynamic MAS environments demonstrate that our method significantly outperforms existing MAS defense mechanisms, contributing an effective guardrail for their trustworthy applications. Our code is available at https://github.com/ChengcanWu/Monitoring-LLM-Based-Multi-Agent-Systems.
主题: 密码学与安全 (cs.CR) ; 人工智能 (cs.AI); 机器学习 (cs.LG); 多智能体系统 (cs.MA); 优化与控制 (math.OC)
引用方式: arXiv:2510.19420 [cs.CR]
  (或者 arXiv:2510.19420v1 [cs.CR] 对于此版本)
  https://doi.org/10.48550/arXiv.2510.19420
通过 DataCite 发表的 arXiv DOI(待注册)

提交历史

来自: Zeming Wei [查看电子邮件]
[v1] 星期三, 2025 年 10 月 22 日 09:43:32 UTC (355 KB)
全文链接:

获取论文:

    查看标题为《》的 PDF
  • 查看中文 PDF
  • 查看 PDF
  • HTML(实验性)
  • TeX 源代码
许可图标 查看许可
当前浏览上下文:
cs.CR
< 上一篇   |   下一篇 >
新的 | 最近的 | 2025-10
切换浏览方式为:
cs
cs.AI
cs.LG
cs.MA
math
math.OC

参考文献与引用

  • NASA ADS
  • 谷歌学术搜索
  • 语义学者
a 导出 BibTeX 引用 加载中...

BibTeX 格式的引用

×
数据由提供:

收藏

BibSonomy logo Reddit logo

文献和引用工具

文献资源探索 (什么是资源探索?)
连接的论文 (什么是连接的论文?)
Litmaps (什么是 Litmaps?)
scite 智能引用 (什么是智能引用?)

与本文相关的代码,数据和媒体

alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)

演示

复制 (什么是复制?)
Hugging Face Spaces (什么是 Spaces?)
TXYZ.AI (什么是 TXYZ.AI?)

推荐器和搜索工具

影响之花 (什么是影响之花?)
核心推荐器 (什么是核心?)
IArxiv 推荐器 (什么是 IArxiv?)
  • 作者
  • 地点
  • 机构
  • 主题

arXivLabs:与社区合作伙伴的实验项目

arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。

与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。

有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.

这篇论文的哪些作者是支持者? | 禁用 MathJax (什么是 MathJax?)
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号