计算机科学 > 人工智能
[提交于 2024年6月8日
(v1)
,最后修订 2025年6月24日 (此版本, v2)]
标题: ChatSR:用于科学公式发现的多模态大语言模型
标题: ChatSR: Multimodal Large Language Models for Scientific Formula Discovery
摘要: 公式是人类与自然之间交流的语言。 从观测数据中发现描述自然规律的公式是科学研究的目的。 这也是人工智能中的一个重要研究课题,称为符号回归问题。 现有的大多数符号回归方法直接从观测数据生成表达式。 尽管在某些方法中,我们可以通过添加约束或引入一些特殊的字符提示来将一些先验知识注入模型中。 然而,这些方法只能引入事先指定的有限量的先验知识。 更不用说理解自然语言指令了。 在本文中,基于多模态大语言模型强大的知识储备和语言理解能力,我们提出了 ChatSR,它就像一位博学的人类科学家,我们可以通过自然语言告诉它任何先验知识,以指导其公式生成。 通过在13个数据集上的测试,ChatSR不仅在传统的符号回归任务上表现出最先进的性能。 更值得注意的是,ChatSR能够很好地理解自然语言提示中包含的先验知识,并提高生成表达式的质量。 此外,令人兴奋的是,ChatSR具有良好的零样本能力,可以理解训练数据中不存在的先验知识。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.