计算机科学 > 机器学习
[提交于 2025年5月30日
]
标题: MOFGPT:使用语言模型的金属有机框架生成设计
标题: MOFGPT: Generative Design of Metal-Organic Frameworks using Language Models
摘要: 具有特定应用性质的金属有机框架(MOFs)的发现仍然是材料化学中的一个核心挑战,因为它们的结构设计空间庞大且复杂。 尽管分子模拟和密度泛函理论(DFT)等常规计算筛选技术准确,但它们在大规模应用时计算成本过高。 机器学习通过利用数据驱动的方法加速材料发现提供了一个令人兴奋的替代方案。 MOFs 的复杂性,因其扩展的周期结构和多样的拓扑结构,为生成建模方法提供了机会和挑战。 为了解决这些挑战,我们提出了一种基于强化学习和变压器的框架,用于从头设计MOFs。 我们的方法的核心是MOFid,一种化学信息字符串表示,编码了连接性和拓扑结构,使生成模型能够扩展。 我们的流程包括三个组件:(1) 在MOFid序列上训练的生成式GPT模型,(2) 基于变压器的MOFormer属性预测器,以及(3) 通过属性引导奖励函数优化生成候选物的强化学习(RL)模块。 通过将属性反馈集成到序列生成中,我们的方法推动模型朝向可合成、拓扑有效的具有所需功能属性的MOFs发展。 这项工作展示了当大型语言模型与强化学习相结合时,在网状化学逆向设计和计算MOF发现的新领域解锁的潜力。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.