计算机科学 > 计算与语言
[提交于 2025年7月28日
]
标题: 用语言表达,用逻辑思考:问答系统中的双进程框架
标题: Speaking in Words, Thinking in Logic: A Dual-Process Framework in QA Systems
摘要: 近年来,大型语言模型(LLMs)的进展显著提升了问答(QA)能力,特别是在开放领域的情境中。 然而,在教育、医疗和法律等封闭领域场景中,用户不仅需要准确的答案,还需要透明的推理过程和可解释的决策机制。 虽然神经符号(NeSy)框架已被视为一种有前景的解决方案,结合了LLMs的自然语言理解和符号系统的形式推理,但现有方法通常依赖于大规模模型,并在将自然语言转化为形式逻辑表示方面表现出效率低下。 为了解决这些限制,我们引入了Text-JEPA(基于文本的联合嵌入预测架构),这是一种轻量且有效的框架,用于将自然语言转化为一阶逻辑(NL2FOL)。 受双系统认知理论的启发,Text-JEPA通过高效生成逻辑表示来模拟系统1,而Z3求解器则作为系统2,实现强大的逻辑推理。 为了严格评估NL2FOL到推理的流程,我们提出了一种综合评估框架,包括三个自定义指标:转换分数、推理分数和Spearman rho分数,它们共同捕捉逻辑翻译的质量及其对推理准确性下游影响。 在特定领域的数据集上的实证结果表明,与更大的LLM系统相比,Text-JEPA实现了具有竞争力的性能,同时计算开销显著降低。 我们的研究结果突显了结构化、可解释的推理框架在构建专用领域高效且可解释的QA系统方面的潜力。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.