计算机科学 > 计算与语言
[提交于 2024年12月31日
(v1)
,最后修订 2025年1月3日 (此版本, v2)]
标题: 通过多路径协作反应和反思代理增强大语言模型推理能力
标题: Enhancing LLM Reasoning with Multi-Path Collaborative Reactive and Reflection agents
摘要: 代理通过大型语言模型在科学推理任务中展示了它们的潜力。 然而,它们在处理复杂推理任务时常常面临准确性不足和思维退化等挑战,这阻碍了它们的表现。 为了克服这些问题,我们提出了具有多路径推理的反应与反思代理(RR-MP)框架,旨在增强大型语言模型的推理能力。 我们的方法通过采用多路径推理机制来提高科学推理的准确性,其中每个路径由一个反应代理和一个反思代理组成,它们协作以防止单一代理依赖所固有的思维退化。 此外,RR-MP框架不需要额外训练;它为每个推理路径使用多个对话实例,并使用一个独立的总结器来整合所有路径的见解。 这种设计整合了多样化的视角,并增强了每条路径的推理能力。 我们在涉及道德情景、大学水平物理和数学的任务上进行了零样本和少样本评估。 实验结果表明,我们的方法优于基线方法,突显了RR-MP框架在管理复杂科学推理任务中的有效性和优势。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.