计算机科学 > 多智能体系统
[提交于 2025年6月1日
]
标题: HASHIRU:用于混合智能资源利用的分层代理系统
标题: HASHIRU: Hierarchical Agent System for Hybrid Intelligent Resource Utilization
摘要: 快速的大语言模型(LLM)进展正在推动自主多智能体系统(MAS)的发展。然而,当前的框架往往缺乏灵活性、资源意识、模型多样性以及自主工具创建能力。本文介绍了一种名为HASHIRU(混合智能资源利用的分层代理系统)的新颖MAS框架,该框架增强了灵活性、资源效率和适应性。HASHIRU具有一个“首席执行官”代理,动态管理专门的“员工”代理,这些代理根据任务需求和资源限制(成本、内存)实例化。其混合智能优先使用较小的本地LLM(通过Ollama),同时灵活地在必要时使用外部API和较大模型。一个带有雇佣/解雇成本的经济模型促进了团队稳定性和高效资源分配。该系统还包括自主API工具创建和记忆功能。在学术论文评审(58%成功率)、安全性评估(在JailbreakBench子集上达到100%)、复杂推理(在GSM8K上优于Gemini 2.0 Flash:96% vs. 61%;在JEEBench上:80% vs. 68.3%;在SVAMP上:92% vs. 84%)等任务上的评估表明了HASHIRU的能力。案例研究展示了其通过自主成本模型生成、工具集成和预算管理实现自我改进的能力。通过动态分层控制、资源感知的混合智能和自主功能扩展,HASHIRU为更强大、高效和适应性强的MAS提供了一个有前景的方法。源代码和基准测试分别可在https://github.com/HASHIRU-AI/HASHIRU 和https://github.com/HASHIRU-AI/HASHIRUBench获取,且可通过请求在https://hashiruagentx-hashiruai.hf.space 获取实时演示。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.