Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > cs > arXiv:2507.05886

帮助 | 高级搜索

计算机科学 > 人工智能

arXiv:2507.05886 (cs)
[提交于 2025年7月8日 ]

标题: 当前构建LLM驱动的推理工具的做法是随意的——我们可以做得更好

标题: Current Practices for Building LLM-Powered Reasoning Tools Are Ad Hoc -- and We Can Do Better

Authors:Aaron Bembenek (The University of Melbourne)
摘要: 对结合传统符号算法和大型语言模型(LLMs)来构建软件验证器、合成器和其他自动化推理(AR)工具的兴趣正在增长。 不幸的是,目前构建这种神经符号AR系统的做法是一种随意的编程模型,它既没有传统符号算法的强保证,也没有足够深入的神经网络和符号推理同步,以释放LLM驱动推理的全部潜力。 我提出神经符号转换系统作为一种有原则的计算模型,可以作为构建神经符号AR工具的基础架构。 在这个模型中,符号状态与直觉配对,状态转换并行地在符号和直觉上操作。 我论证了为什么这个新范式可以在保持符号算法强保证的同时,将逻辑推理扩展到当前能力之外,并简要描述了我提出的计算模型如何在逻辑编程语言中实现。
摘要: There is growing excitement about building software verifiers, synthesizers, and other Automated Reasoning (AR) tools by combining traditional symbolic algorithms and Large Language Models (LLMs). Unfortunately, the current practice for constructing such neurosymbolic AR systems is an ad hoc programming model that does not have the strong guarantees of traditional symbolic algorithms, nor a deep enough synchronization of neural networks and symbolic reasoning to unlock the full potential of LLM-powered reasoning. I propose Neurosymbolic Transition Systems as a principled computational model that can underlie infrastructure for building neurosymbolic AR tools. In this model, symbolic state is paired with intuition, and state transitions operate over symbols and intuition in parallel. I argue why this new paradigm can scale logical reasoning beyond current capabilities while retaining the strong guarantees of symbolic algorithms, and I sketch out how the computational model I propose can be reified in a logic programming language.
评论: 6页,4图
主题: 人工智能 (cs.AI) ; 编程语言 (cs.PL)
引用方式: arXiv:2507.05886 [cs.AI]
  (或者 arXiv:2507.05886v1 [cs.AI] 对于此版本)
  https://doi.org/10.48550/arXiv.2507.05886
通过 DataCite 发表的 arXiv DOI

提交历史

来自: Aaron Bembenek [查看电子邮件]
[v1] 星期二, 2025 年 7 月 8 日 11:19:09 UTC (78 KB)
全文链接:

获取论文:

    查看标题为《》的 PDF
  • 查看中文 PDF
  • 查看 PDF
  • HTML(实验性)
  • TeX 源代码
  • 其他格式
查看许可
当前浏览上下文:
cs.AI
< 上一篇   |   下一篇 >
新的 | 最近的 | 2025-07
切换浏览方式为:
cs
cs.PL

参考文献与引用

  • NASA ADS
  • 谷歌学术搜索
  • 语义学者
a 导出 BibTeX 引用 加载中...

BibTeX 格式的引用

×
数据由提供:

收藏

BibSonomy logo Reddit logo

文献和引用工具

文献资源探索 (什么是资源探索?)
连接的论文 (什么是连接的论文?)
Litmaps (什么是 Litmaps?)
scite 智能引用 (什么是智能引用?)

与本文相关的代码,数据和媒体

alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)

演示

复制 (什么是复制?)
Hugging Face Spaces (什么是 Spaces?)
TXYZ.AI (什么是 TXYZ.AI?)

推荐器和搜索工具

影响之花 (什么是影响之花?)
核心推荐器 (什么是核心?)
IArxiv 推荐器 (什么是 IArxiv?)
  • 作者
  • 地点
  • 机构
  • 主题

arXivLabs:与社区合作伙伴的实验项目

arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。

与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。

有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.

这篇论文的哪些作者是支持者? | 禁用 MathJax (什么是 MathJax?)
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号