定量生物学 > 定量方法
[提交于 2025年1月10日
]
标题: 生物信息学中的大型语言模型
标题: Large Language Models for Bioinformatics
摘要: 随着大规模语言模型(LLM)技术的快速发展以及生物信息学专用语言模型(BioLMs)的出现,对当前发展状况、计算特征和多样化应用进行全面分析的需求日益增长。 本综述旨在通过提供对BioLMs的全面回顾来满足这一需求,重点介绍其演变过程、分类及显著特征,并详细探讨训练方法、数据集和评估框架。 我们研究了BioLMs在疾病诊断、药物发现和疫苗开发等关键领域的广泛应用,突显了它们在生物信息学中的影响和变革潜力。 我们识别了BioLMs中固有的关键挑战和局限性,包括数据隐私和安全问题、可解释性问题、训练数据和模型输出中的偏见以及领域适应的复杂性。 最后,我们突出了新兴趋势和未来方向,为研究人员和临床医生提供了有价值的见解,以推动BioLMs在日益复杂的生物学和临床应用中的发展。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.