计算机科学 > 人工智能
[提交于 2025年8月5日
]
标题: 神经符号人工智能方法在可解释逻辑推理中的比较研究
标题: A Comparative Study of Neurosymbolic AI Approaches to Interpretable Logical Reasoning
摘要: 通用逻辑推理,定义为在领域无关任务上进行演绎推理的能力,仍然是大型语言模型(LLMs)的挑战。当前的LLMs无法进行确定性推理,并且不可解释。因此,神经符号人工智能最近引起了广泛关注,它试图将逻辑融入神经网络中。我们首先确定了两种改进逻辑推理的神经符号方法:(i)集成方法,其中符号推理包含在神经网络中;(ii)混合方法,其中与神经网络分开的符号求解器执行符号推理。这两种方法都包含在特定领域逻辑推理基准测试中表现良好的AI系统。然而,它们在领域无关基准测试上的表现研究不足。据我们所知,还没有对对比方法进行比较,以回答以下问题:哪种方法在开发通用逻辑推理方面更有前景?为了分析它们的潜力,介绍了以下最佳领域的无关模型:逻辑神经网络(LNN),它使用集成方法;以及LLM-符号求解器(LLM-SS),它使用混合方法。使用这两种模型作为每种方法的案例研究和代表,我们的分析表明,混合方法在开发通用逻辑推理方面更有前景,因为(i)它的推理链更具可解释性,(ii)它保留了现有LLMs的功能和优势。为了支持未来使用混合方法的工作,我们提出了一种基于LLM-SS的可推广框架,该框架设计为模块化、模型无关、领域无关,并且需要很少甚至不需要人工输入。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.