计算机科学 > 机器学习
[提交于 2025年9月5日
]
标题: 通过嵌入空间中的贝叶斯优化对蛋白质进行定向进化
标题: Directed Evolution of Proteins via Bayesian Optimization in Embedding Space
摘要: 定向进化是一种通过迭代合成新的蛋白质变体并使用昂贵且耗时的生化筛选来评估其所需特性的实验室过程,以设计功能更优的蛋白质。 机器学习方法可以帮助选择有信息量或有前景的变体进行筛选,从而提高其质量并减少所需的筛选数量。 在本文中,我们提出了一种用于蛋白质定向进化的机器学习辅助新方法,该方法结合了贝叶斯优化与从预训练蛋白质语言模型中提取的信息表示。 我们证明基于序列嵌入的新表示显著提高了贝叶斯优化的性能,在总筛选次数相同的情况下取得了更好的结果。 同时,我们的方法在回归目标下优于最先进的机器学习辅助定向进化方法。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.