计算机科学 > 机器学习
[提交于 2025年1月30日
]
标题: MolGraph-xLSTM:一种基于图的双层xLSTM框架,结合多头专家混合以增强分子表示和可解释性
标题: MolGraph-xLSTM: A graph-based dual-level xLSTM framework with multi-head mixture-of-experts for enhanced molecular representation and interpretability
摘要: 预测分子性质对于药物发现至关重要,计算方法可以大大增强这一过程。分子图已成为表示学习的焦点,图神经网络(GNNs)被广泛使用。然而,GNNs常常难以捕捉长距离依赖关系。为了解决这个问题,我们提出了MolGraph-xLSTM,一种新颖的基于图的xLSTM模型,该模型增强了特征提取并有效建模分子的长距离相互作用。我们的方法在两个尺度上处理分子图:原子级和基序级。对于原子级图,一个基于GNN的xLSTM框架结合跳跃知识提取局部特征,并聚合多层信息以有效捕捉局部和全局模式。基序级图提供了互补的结构信息,以获得更广泛的分子视图。两个尺度的嵌入通过多头专家混合(MHMoE)进行优化,进一步增强了表达能力和性能。我们在10个分子性质预测数据集上验证了MolGraph-xLSTM,涵盖了分类和回归任务。我们的模型在所有数据集上表现出一致的性能,与基线相比,在BBBP数据集上的分类任务中提高了7.03%,在ESOL数据集上的回归任务中提高了7.54%。平均而言,与基线方法相比,MolGraph-xLSTM在分类任务中的AUROC提高了3.18%,在回归数据集上的RMSE降低了3.83%。这些结果证实了我们模型的有效性,为药物发现中的分子表示学习提供了一个有前景的解决方案。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.