Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > cs > arXiv:2507.19902

帮助 | 高级搜索

计算机科学 > 软件工程

arXiv:2507.19902 (cs)
[提交于 2025年7月26日 ]

标题: AgentMesh:一种用于软件开发自动化的协作多智能体生成式人工智能框架

标题: AgentMesh: A Cooperative Multi-Agent Generative AI Framework for Software Development Automation

Authors:Sourena Khanzadeh
摘要: 软件开发是一个复杂的多阶段过程,传统上需要具有不同专业知识的个体之间的协作。 我们提出 AgentMesh,一个基于Python的框架,该框架使用多个协作的LLM驱动代理来自动化软件开发任务。 在AgentMesh中,专门的代理 - 一个规划者、编码者、调试器和审查者 - 协同工作,将高层次的需求转化为完整的代码。 规划者代理首先将用户请求分解为具体的子任务;编码者代理将每个子任务实现为代码;调试者代理测试并修复代码;而 审查者代理验证最终输出的正确性和质量。 我们描述了这些代理及其通信的架构和设计,并提供了包括提示策略和工作流编排在内的实现细节。 一个案例研究说明了AgentMesh通过顺序任务规划、代码生成、迭代调试和最终代码审查来处理一个非平凡的开发请求。 我们讨论了如何在协作代理之间分配责任,以利用大型语言模型的优势,同时减轻单个代理的局限性。 最后,我们检查了当前的局限性——例如错误传播和上下文扩展——并概述了未来的工作方向,以实现更稳健、可扩展的多代理AI系统,用于软件工程自动化。
摘要: Software development is a complex, multi-phase process traditionally requiring collaboration among individuals with diverse expertise. We propose AgentMesh, a Python-based framework that uses multiple cooperating LLM-powered agents to automate software development tasks. In AgentMesh, specialized agents - a Planner, Coder, Debugger, and Reviewer - work in concert to transform a high-level requirement into fully realized code. The Planner agent first decomposes user requests into concrete subtasks; the Coder agent implements each subtask in code; the Debugger agent tests and fixes the code; and the Reviewer agent validates the final output for correctness and quality. We describe the architecture and design of these agents and their communication, and provide implementation details including prompt strategies and workflow orchestration. A case study illustrates AgentMesh handling a non-trivial development request via sequential task planning, code generation, iterative debugging, and final code review. We discuss how dividing responsibilities among cooperative agents leverages the strengths of large language models while mitigating single-agent limitations. Finally, we examine current limitations - such as error propagation and context scaling - and outline future work toward more robust, scalable multi-agent AI systems for software engineering automation.
主题: 软件工程 (cs.SE) ; 人工智能 (cs.AI)
引用方式: arXiv:2507.19902 [cs.SE]
  (或者 arXiv:2507.19902v1 [cs.SE] 对于此版本)
  https://doi.org/10.48550/arXiv.2507.19902
通过 DataCite 发表的 arXiv DOI

提交历史

来自: Sourena Khanzadeh [查看电子邮件]
[v1] 星期六, 2025 年 7 月 26 日 10:10:02 UTC (21 KB)
全文链接:

获取论文:

    查看标题为《》的 PDF
  • 查看中文 PDF
  • 查看 PDF
  • HTML(实验性)
  • TeX 源代码
  • 其他格式
查看许可
当前浏览上下文:
cs.SE
< 上一篇   |   下一篇 >
新的 | 最近的 | 2025-07
切换浏览方式为:
cs
cs.AI

参考文献与引用

  • NASA ADS
  • 谷歌学术搜索
  • 语义学者
a 导出 BibTeX 引用 加载中...

BibTeX 格式的引用

×
数据由提供:

收藏

BibSonomy logo Reddit logo

文献和引用工具

文献资源探索 (什么是资源探索?)
连接的论文 (什么是连接的论文?)
Litmaps (什么是 Litmaps?)
scite 智能引用 (什么是智能引用?)

与本文相关的代码,数据和媒体

alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)

演示

复制 (什么是复制?)
Hugging Face Spaces (什么是 Spaces?)
TXYZ.AI (什么是 TXYZ.AI?)

推荐器和搜索工具

影响之花 (什么是影响之花?)
核心推荐器 (什么是核心?)
IArxiv 推荐器 (什么是 IArxiv?)
  • 作者
  • 地点
  • 机构
  • 主题

arXivLabs:与社区合作伙伴的实验项目

arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。

与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。

有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.

这篇论文的哪些作者是支持者? | 禁用 MathJax (什么是 MathJax?)
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号