Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > q-bio > arXiv:2501.01477

帮助 | 高级搜索

定量生物学 > 生物大分子

arXiv:2501.01477 (q-bio)
[提交于 2025年1月2日 ]

标题: 蛋白质生物信息学中深度学习方法的综述及其对蛋白质设计的影响

标题: A Survey of Deep Learning Methods in Protein Bioinformatics and its Impact on Protein Design

Authors:Weihang Dai
摘要: 蛋白质是氨基酸的序列,作为生物体的基本构建块。 尽管记录各种蛋白质序列的结构和功能信息的数据库迅速增长,但由于可能的序列空间庞大以及分子间和分子内力的复杂性,我们对蛋白质的理解仍然有限。 深度学习以其能够直接从大数据集中学习相关特征的能力为特点,在计算机视觉和自然语言处理等领域表现出色。 近年来,它也被越来越多地应用于蛋白质序列这一数据丰富的领域,并取得了巨大成功,最著名的是AlphaFold2在蛋白质结构预测中的突破性表现。 深度学习取得的性能提升为蛋白质生物信息学领域带来了新的可能性,包括蛋白质设计,这是最具挑战性但最有用的任务之一。 在本文中,我们将蛋白质生物信息学中的问题大致分为三个主要类别:1)结构预测,2)功能预测,3)蛋白质设计,并回顾了在每个领域中使用深度学习方法所取得的进展。 我们进一步探讨了蛋白质设计问题的主要挑战,并强调了结构和功能预测的进展如何直接促进了设计任务。 最后,我们通过识别重要主题和未来研究方向来总结。
摘要: Proteins are sequences of amino acids that serve as the basic building blocks of living organisms. Despite rapidly growing databases documenting structural and functional information for various protein sequences, our understanding of proteins remains limited because of the large possible sequence space and the complex inter- and intra-molecular forces. Deep learning, which is characterized by its ability to learn relevant features directly from large datasets, has demonstrated remarkable performance in fields such as computer vision and natural language processing. It has also been increasingly applied in recent years to the data-rich domain of protein sequences with great success, most notably with Alphafold2's breakout performance in the protein structure prediction. The performance improvements achieved by deep learning unlocks new possibilities in the field of protein bioinformatics, including protein design, one of the most difficult but useful tasks. In this paper, we broadly categorize problems in protein bioinformatics into three main categories: 1) structural prediction, 2) functional prediction, and 3) protein design, and review the progress achieved from using deep learning methodologies in each of them. We expand on the main challenges of the protein design problem and highlight how advances in structural and functional prediction have directly contributed to design tasks. Finally, we conclude by identifying important topics and future research directions.
评论: 博士资格考试(2021)
主题: 生物大分子 (q-bio.BM) ; 人工智能 (cs.AI)
引用方式: arXiv:2501.01477 [q-bio.BM]
  (或者 arXiv:2501.01477v1 [q-bio.BM] 对于此版本)
  https://doi.org/10.48550/arXiv.2501.01477
通过 DataCite 发表的 arXiv DOI

提交历史

来自: Weihang Dai [查看电子邮件]
[v1] 星期四, 2025 年 1 月 2 日 05:21:34 UTC (3,010 KB)
全文链接:

获取论文:

    查看标题为《》的 PDF
  • 查看中文 PDF
  • 查看 PDF
  • HTML(实验性)
  • TeX 源代码
  • 其他格式
查看许可
当前浏览上下文:
q-bio.BM
< 上一篇   |   下一篇 >
新的 | 最近的 | 2025-01
切换浏览方式为:
cs
cs.AI
q-bio

参考文献与引用

  • NASA ADS
  • 谷歌学术搜索
  • 语义学者
a 导出 BibTeX 引用 加载中...

BibTeX 格式的引用

×
数据由提供:

收藏

BibSonomy logo Reddit logo

文献和引用工具

文献资源探索 (什么是资源探索?)
连接的论文 (什么是连接的论文?)
Litmaps (什么是 Litmaps?)
scite 智能引用 (什么是智能引用?)

与本文相关的代码,数据和媒体

alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)

演示

复制 (什么是复制?)
Hugging Face Spaces (什么是 Spaces?)
TXYZ.AI (什么是 TXYZ.AI?)

推荐器和搜索工具

影响之花 (什么是影响之花?)
核心推荐器 (什么是核心?)
IArxiv 推荐器 (什么是 IArxiv?)
  • 作者
  • 地点
  • 机构
  • 主题

arXivLabs:与社区合作伙伴的实验项目

arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。

与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。

有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.

这篇论文的哪些作者是支持者? | 禁用 MathJax (什么是 MathJax?)
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号