定量生物学 > 生物大分子
[提交于 2025年1月2日
]
标题: 蛋白质生物信息学中深度学习方法的综述及其对蛋白质设计的影响
标题: A Survey of Deep Learning Methods in Protein Bioinformatics and its Impact on Protein Design
摘要: 蛋白质是氨基酸的序列,作为生物体的基本构建块。 尽管记录各种蛋白质序列的结构和功能信息的数据库迅速增长,但由于可能的序列空间庞大以及分子间和分子内力的复杂性,我们对蛋白质的理解仍然有限。 深度学习以其能够直接从大数据集中学习相关特征的能力为特点,在计算机视觉和自然语言处理等领域表现出色。 近年来,它也被越来越多地应用于蛋白质序列这一数据丰富的领域,并取得了巨大成功,最著名的是AlphaFold2在蛋白质结构预测中的突破性表现。 深度学习取得的性能提升为蛋白质生物信息学领域带来了新的可能性,包括蛋白质设计,这是最具挑战性但最有用的任务之一。 在本文中,我们将蛋白质生物信息学中的问题大致分为三个主要类别:1)结构预测,2)功能预测,3)蛋白质设计,并回顾了在每个领域中使用深度学习方法所取得的进展。 我们进一步探讨了蛋白质设计问题的主要挑战,并强调了结构和功能预测的进展如何直接促进了设计任务。 最后,我们通过识别重要主题和未来研究方向来总结。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.