计算机科学 > 多智能体系统
[提交于 2025年6月9日
(v1)
,最后修订 2025年6月16日 (此版本, v2)]
标题: G-内存:多智能体系统的分层内存追踪
标题: G-Memory: Tracing Hierarchical Memory for Multi-Agent Systems
摘要: 大型语言模型(LLM)驱动的多智能体系统(MAS)已经展示了远超单个LLM代理的认知和执行能力,但它们的自我进化能力仍受到记忆架构发展不足的限制。 经过仔细检查,我们惊讶地发现当前的MAS记忆机制(1)过于简单化,完全忽略了复杂的跨代理协作轨迹,并且(2)缺乏跨试验和特定代理的定制化,这与为单个代理开发的表达性记忆形成了鲜明对比。 为弥合这一差距,我们引入了G-Memory,这是一种受组织记忆理论启发的分层代理记忆系统,用于MAS,通过三层图层次结构管理长时间的MAS交互:洞见图、查询图和交互图。 当接收到新的用户查询时,G-Memory执行双向记忆遍历以检索既能使系统利用跨试验知识的$\textit{high-level, generalizable insights}$和能紧凑编码先前协作经验的$\textit{fine-grained, condensed interaction trajectories}$。 在任务执行过程中,整个层次结构通过同化新的协作轨迹而演变,促进代理团队的逐步进化。 在五个基准数据集、三种LLM主干网络和三种流行的MAS框架上的广泛实验表明,G-Memory分别将具身行动的成功率和知识问答的准确性提高了$20.89\%$和$10.12\%$,而无需对原始框架进行任何修改。 我们的代码可在https://github.com/bingreeky/GMemory获取。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.