Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > cs > arXiv:2406.00252v2

帮助 | 高级搜索

计算机科学 > 人工智能

arXiv:2406.00252v2 (cs)
[提交于 2024年6月1日 (v1) ,修订后的 2024年6月5日 (此版本, v2) , 最新版本 2025年2月16日 (v6) ]

标题: 多模态和多智能体系统与理性相遇:综述

标题: Multi-Modal and Multi-Agent Systems Meet Rationality: A Survey

Authors:Bowen Jiang, Yangxinyu Xie, Xiaomeng Wang, Weijie J. Su, Camillo J. Taylor, Tanwi Mallick
摘要: 理性是指受理性指导的品质,其特点是符合证据和逻辑规则的逻辑思维和决策。 这种品质对于有效的解决问题至关重要,因为它确保解决方案有坚实的基础并系统地得出。 尽管大型语言模型(LLMs)在生成具有显著准确性的类人文本方面取得了进展,但它们会继承训练数据中的偏见,在不同上下文中表现出不一致,并且在理解涉及多层上下文的复杂场景时存在困难。 因此,最近的研究尝试利用多个代理协同工作,结合不同类型的数据和工具,以提高一致性和可靠性。 为此,本文旨在通过调查最新研究,了解多模态和多代理系统是否正在向理性发展,识别在理性方面相对于单代理和单模态系统的进步,并讨论开放问题和未来方向。 我们在 https://github.com/bowen-upenn/MMMA_Rationality 保持一个开放的代码库。
摘要: Rationality is the quality of being guided by reason, characterized by logical thinking and decision-making that align with evidence and logical rules. This quality is essential for effective problem-solving, as it ensures that solutions are well-founded and systematically derived. Despite the advancements of large language models (LLMs) in generating human-like text with remarkable accuracy, they present biases inherited from the training data, inconsistency across different contexts, and difficulty understanding complex scenarios involving multiple layers of context. Therefore, recent research attempts to leverage the strength of multiple agents working collaboratively with various types of data and tools for enhanced consistency and reliability. To that end, this paper aims to understand whether multi-modal and multi-agent systems are advancing toward rationality by surveying the state-of-the-art works, identifying advancements over single-agent and single-modal systems in terms of rationality, and discussing open problems and future directions. We maintain an open repository at https://github.com/bowen-upenn/MMMA_Rationality.
主题: 人工智能 (cs.AI) ; 计算与语言 (cs.CL); 计算机视觉与模式识别 (cs.CV); 多智能体系统 (cs.MA)
引用方式: arXiv:2406.00252 [cs.AI]
  (或者 arXiv:2406.00252v2 [cs.AI] 对于此版本)
  https://doi.org/10.48550/arXiv.2406.00252
通过 DataCite 发表的 arXiv DOI

提交历史

来自: Bowen Jiang [查看电子邮件]
[v1] 星期六, 2024 年 6 月 1 日 01:17:25 UTC (2,332 KB)
[v2] 星期三, 2024 年 6 月 5 日 19:39:56 UTC (2,332 KB)
[v3] 星期二, 2024 年 6 月 18 日 04:22:39 UTC (4,650 KB)
[v4] 星期二, 2024 年 10 月 15 日 20:11:42 UTC (3,975 KB)
[v5] 星期六, 2025 年 2 月 8 日 20:48:13 UTC (3,980 KB)
[v6] 星期日, 2025 年 2 月 16 日 05:30:30 UTC (3,980 KB)
全文链接:

获取论文:

    查看标题为《》的 PDF
  • 查看中文 PDF
  • 查看 PDF
  • HTML(实验性)
  • 其他格式
查看许可
当前浏览上下文:
cs.AI
< 上一篇   |   下一篇 >
新的 | 最近的 | 2024-06
切换浏览方式为:
cs
cs.CL
cs.CV
cs.MA

参考文献与引用

  • NASA ADS
  • 谷歌学术搜索
  • 语义学者
a 导出 BibTeX 引用 加载中...

BibTeX 格式的引用

×
数据由提供:

收藏

BibSonomy logo Reddit logo

文献和引用工具

文献资源探索 (什么是资源探索?)
连接的论文 (什么是连接的论文?)
Litmaps (什么是 Litmaps?)
scite 智能引用 (什么是智能引用?)

与本文相关的代码,数据和媒体

alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)

演示

复制 (什么是复制?)
Hugging Face Spaces (什么是 Spaces?)
TXYZ.AI (什么是 TXYZ.AI?)

推荐器和搜索工具

影响之花 (什么是影响之花?)
核心推荐器 (什么是核心?)
IArxiv 推荐器 (什么是 IArxiv?)
  • 作者
  • 地点
  • 机构
  • 主题

arXivLabs:与社区合作伙伴的实验项目

arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。

与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。

有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.

这篇论文的哪些作者是支持者? | 禁用 MathJax (什么是 MathJax?)
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号