计算机科学 > 计算与语言
[提交于 2025年7月2日
]
标题: 重新思考所有证据:通过冲突驱动的摘要增强可信的检索增强生成
标题: Rethinking All Evidence: Enhancing Trustworthy Retrieval-Augmented Generation via Conflict-Driven Summarization
摘要: 检索增强生成(RAG)通过将参数知识与外部检索内容相结合,增强了大型语言模型(LLMs)的能力。 然而,由于内部不一致或噪声检索内容导致的知识冲突会严重削弱RAG系统的生成可靠性。在本工作中,我们认为在生成响应之前,LLMs应重新考虑所有证据,包括检索内容和内部知识。我们提出了CARE-RAG(面向冲突的RAG可靠证据),一种通过所有可用证据的冲突驱动摘要来提高可信度的新框架。CARE-RAG首先通过比较参数记录来推导出参数感知的证据,以识别多样化的内部视角。 然后,它对检索到的证据进行精炼,以生成上下文感知的证据,去除无关或具有误导性的内容。为了检测和摘要冲突,我们蒸馏了一个3B的LLaMA3.2模型来进行冲突驱动的摘要,从而实现在多个来源之间的可靠综合。为了进一步确保评估的完整性,我们引入了一个QA修复步骤来纠正过时或模糊的基准答案。在包含检索数据的修订后的QA数据集上的实验表明,CARE-RAG始终优于强大的RAG基线,特别是在存在噪声或冲突证据的场景中。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.