计算机科学 > 机器学习
[提交于 2025年7月16日
]
标题: Protenix-Mini:通过紧凑架构、少步扩散和可切换pLM的高效结构预测器
标题: Protenix-Mini: Efficient Structure Predictor via Compact Architecture, Few-Step Diffusion and Switchable pLM
摘要: 轻量级推理对于生物分子结构预测和其他下游任务至关重要,它使得大规模应用的高效实际部署和推理时扩展成为可能。 在本工作中,我们通过做出几个关键修改来解决模型效率与预测准确性之间的平衡挑战,1) 将多步骤AF3采样器替换为几步的常微分方程(ODE)采样器,显著减少了推理过程中扩散模块部分的计算开销;2) 在开源Protenix框架中,一部分pairformer或扩散Transformer块对最终结构预测没有贡献,这为架构剪枝和轻量级重新设计提供了机会;3) 训练了一个包含ESM模块的模型以替代传统的MSA模块,从而减少了MSA预处理时间。 基于这些关键见解,我们提出了Protenix-Mini,这是一个紧凑且优化的模型,旨在实现高效的蛋白质结构预测。 这个简化版本采用了更高效的架构设计,结合了两步常微分方程(ODE)采样策略。 通过消除冗余的Transformer组件并优化采样过程,Protenix-Mini显著降低了模型复杂度,仅带来轻微的准确性下降。 在基准数据集上的评估表明,它实现了高保真预测,与全规模模型相比,在基准数据集上的性能仅略有1%到5%的下降。 这使得Protenix-Mini成为计算资源有限但准确结构预测仍至关重要的应用的理想选择。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.