物理学 > 化学物理
[提交于 2025年7月1日
]
标题: 通过线性张量化四边形注意力的可扩展且量子精确的生物分子力场基础模型
标题: A Scalable and Quantum-Accurate Foundation Model for Biomolecular Force Field via Linearly Tensorized Quadrangle Attention
摘要: 精确的原子级生物分子模拟对于疾病机制的理解、药物发现和生物材料设计至关重要,但现有的模拟方法存在显著的局限性。 经典力场方法效率高,但在许多化学和生物过程中至关重要的过渡态和精细构象细节方面缺乏准确性。 量子力学(QM)方法精度高,但对于大规模或长时间的模拟计算上不可行。 基于人工智能的力场(AIFFs)旨在实现与QM相当的精度,同时保持效率,但在多体建模复杂性、精度和速度之间难以平衡,通常受到有限训练数据和泛化能力验证不足的限制。 为克服这些挑战,我们引入了LiTEN,这是一种具有张量化四边形注意力(TQA)的新颖等变神经网络。 TQA通过向量运算重新参数化高阶张量特征,以线性复杂度高效地建模三体和四体相互作用,避免了昂贵的球面谐波计算。 在LiTEN的基础上,LiTEN-FF是一个强大的AIFF基础模型,使用广泛的nablaDFT数据集进行预训练,以实现广泛的化学泛化,并在SPICE上进行微调,以实现准确的溶剂化系统模拟。 LiTEN在rMD17、MD22和Chignolin的大多数评估子集上实现了最先进的(SOTA)性能,优于MACE、NequIP和EquiFormer等领先模型。 LiTEN-FF迄今为止提供了最全面的下游生物分子建模任务套件,包括QM级别的构象搜索、几何优化和自由能表面构建,同时在大型生物分子(约1000个原子)上的推理速度比MACE-OFF快10倍。 总之,我们提出了一种物理基础坚实、高效的高度框架,推动了复杂生物分子建模的发展,为药物发现及相关应用提供了一个多功能的基础。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.