物理学 > 化学物理
[提交于 2022年12月2日
]
标题: 从解决机器学习分类问题中获得可迁移的化学见解:热力学性质预测,原子组成优于库仑矩阵
标题: Obtaining transferable chemical insight from solving machine-learning classification problems: Thermodynamical properties prediction, atomic composition as good as Coulomb matrix
摘要: 机器学习(ML)可用于构建代理模型,以快速预测感兴趣属性。 因此,ML可以应用于化学项目,其中通常的实验或计算技术对于一个样本可能需要数小时或数天。 通过这种方式,可以从广泛的数据库中提取最有希望的候选样本,并进行更深入的分析。 尽管它们具有广泛的应用性,但将ML方法应用于给定的化学问题可能会很具挑战性,因为必须做出大量设计决策,例如使用哪种分子描述符或训练模型的优化器。 在这里,我们提出了一种通过分类实验对给定分子问题进行有意义探索的方法。 这种概念上简单的方法能提供关于所选问题的可转移见解,并可用作估计预测难度、测试和优化分子表示以及开展更精确或更具雄心的项目的平台。 还可以获得物理化学方面的见解。 该方法通过使用多种分子描述符来预测来自公共数据库QM9 [Ramakrishnan2014] 中的分子的焓、吉布斯自由能、零点振动能量和定容热量容量进行说明,该数据库包含133,885种有机分子。 值得注意的结果是,对于我们提出的分类问题,低分辨率描述符“原子组成”[Tchagang2019] 在训练期间使用适当的优化器时,可以达到几乎与高分辨率“排序库仑矩阵”[Rupp2012,Montavon2012,Hansen2013] ($>90\%$) 相当的分类率。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.