Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > physics > arXiv:2507.00407

帮助 | 高级搜索

物理学 > 化学物理

arXiv:2507.00407 (physics)
[提交于 2025年7月1日 ]

标题: 通过机器学习原子间势能函数增强分子图的几何结构

标题: Augmenting Molecular Graphs with Geometries via Machine Learning Interatomic Potentials

Authors:Cong Fu, Yuchao Lin, Zachary Krueger, Haiyang Yu, Maho Nakata, Jianwen Xie, Emine Kucukbenli, Xiaofeng Qian, Shuiwang Ji
摘要: 准确的分子性质预测需要三维几何结构,这些通常通过昂贵的方法如密度泛函理论(DFT)获得。在这里,我们尝试仅依靠机器学习原子间势(MLIP)模型来获得分子几何结构。为此,我们首先整理了一个大规模的分子弛豫数据集,包含350万个分子和3亿个快照。然后,使用监督学习训练MLIP基础模型,以给定的三维分子结构预测能量和力。一旦训练完成,我们表明基础模型可以以不同的方式使用,以显式或隐式的方式获得几何结构。首先,可以通过几何优化获得低能三维几何结构,为下游分子性质预测提供弛豫的三维几何结构。为了减轻潜在偏差并增强下游预测,我们基于弛豫的三维几何结构引入了几何微调。其次,当有真实三维几何结构时,可以对基础模型直接进行属性预测微调。我们的结果表明,基于弛豫数据训练的MLIP基础模型可以提供有益于属性预测的有价值的分子几何结构。
摘要: Accurate molecular property predictions require 3D geometries, which are typically obtained using expensive methods such as density functional theory (DFT). Here, we attempt to obtain molecular geometries by relying solely on machine learning interatomic potential (MLIP) models. To this end, we first curate a large-scale molecular relaxation dataset comprising 3.5 million molecules and 300 million snapshots. Then MLIP foundation models are trained with supervised learning to predict energy and forces given 3D molecular structures. Once trained, we show that the foundation models can be used in different ways to obtain geometries either explicitly or implicitly. First, it can be used to obtain low-energy 3D geometries via geometry optimization, providing relaxed 3D geometries for downstream molecular property predictions. To mitigate potential biases and enhance downstream predictions, we introduce geometry fine-tuning based on the relaxed 3D geometries. Second, the foundation models can be directly fine-tuned for property prediction when ground truth 3D geometries are available. Our results demonstrate that MLIP foundation models trained on relaxation data can provide valuable molecular geometries that benefit property predictions.
主题: 化学物理 (physics.chem-ph) ; 人工智能 (cs.AI); 定量方法 (q-bio.QM)
引用方式: arXiv:2507.00407 [physics.chem-ph]
  (或者 arXiv:2507.00407v1 [physics.chem-ph] 对于此版本)
  https://doi.org/10.48550/arXiv.2507.00407
通过 DataCite 发表的 arXiv DOI

提交历史

来自: Cong Fu [查看电子邮件]
[v1] 星期二, 2025 年 7 月 1 日 03:49:11 UTC (140 KB)
全文链接:

获取论文:

    查看标题为《》的 PDF
  • 查看中文 PDF
  • 查看 PDF
  • HTML(实验性)
  • TeX 源代码
  • 其他格式
查看许可
当前浏览上下文:
physics
< 上一篇   |   下一篇 >
新的 | 最近的 | 2025-07
切换浏览方式为:
cs
cs.AI
physics.chem-ph
q-bio
q-bio.QM

参考文献与引用

  • NASA ADS
  • 谷歌学术搜索
  • 语义学者
a 导出 BibTeX 引用 加载中...

BibTeX 格式的引用

×
数据由提供:

收藏

BibSonomy logo Reddit logo

文献和引用工具

文献资源探索 (什么是资源探索?)
连接的论文 (什么是连接的论文?)
Litmaps (什么是 Litmaps?)
scite 智能引用 (什么是智能引用?)

与本文相关的代码,数据和媒体

alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)

演示

复制 (什么是复制?)
Hugging Face Spaces (什么是 Spaces?)
TXYZ.AI (什么是 TXYZ.AI?)

推荐器和搜索工具

影响之花 (什么是影响之花?)
核心推荐器 (什么是核心?)
IArxiv 推荐器 (什么是 IArxiv?)
  • 作者
  • 地点
  • 机构
  • 主题

arXivLabs:与社区合作伙伴的实验项目

arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。

与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。

有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.

这篇论文的哪些作者是支持者? | 禁用 MathJax (什么是 MathJax?)
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号