计算机科学 > 计算与语言
[提交于 2025年6月26日
]
标题: 文本到Cypher跨语言:评估超越英语的基础模型
标题: Text2Cypher Across Languages: Evaluating Foundational Models Beyond English
摘要: 最近大型语言模型的进展使得自然语言接口成为可能,这些接口可以将用户的问题转化为数据库查询,例如Text2SQL、Text2SPARQL和Text2Cypher。 尽管这些接口增强了数据库的可访问性,但目前大多数研究仅关注英语,其他语言的评估有限。 本文研究了基础LLM在多种语言上的Text2Cypher任务表现。 我们通过将英语问题翻译成西班牙语和土耳其语而保留原始Cypher查询,创建并发布了多语言测试集,从而实现了公平的跨语言比较。 我们使用标准化提示和指标对多个基础模型进行了评估。 我们的结果显示出一致的表现模式:英语表现最高,其次是西班牙语,最后是土耳其语。 我们认为这是由于训练数据可用性和语言特征的差异造成的。 此外,我们探讨了将任务提示翻译成西班牙语和土耳其语的影响。 结果表明评估指标几乎没有变化,这表明提示翻译影响较小。 我们的发现强调了在多语言查询生成中需要更加包容的评估和开发。 未来的工作包括模式本地化和在多种语言上的微调。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.