定量生物学 > 生物大分子
[提交于 2025年1月29日
]
标题: 分子指纹是肽功能预测的强大模型
标题: Molecular Fingerprints Are Strong Models for Peptide Function Prediction
摘要: 我们研究了分子指纹在肽性质预测中的有效性,并证明从分子图中提取的领域特定特征可以超越复杂且计算成本高的模型,如GNN、预训练序列基础的变压器和多模态集成,即使没有超参数调整。为此,我们在126个数据集上进行了全面评估,在LRGB和5个其他肽功能预测基准上取得了最先进的结果。我们表明,基于ECFP计数变体、拓扑扭转和RDKit分子指纹以及LightGBM作为分类头的模型具有显著的鲁棒性。分子指纹的优异性能,它们本质上是非常短程特征编码器,挑战了肽中长程相互作用的重要性的假设。我们的结论是,对于较大的分子,如肽,使用分子指纹可以作为复杂深度学习模型的一种计算可行、低参数和多功能的替代方案。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.