计算机科学 > 计算与语言
[提交于 2025年1月14日
(v1)
,最后修订 2025年1月15日 (此版本, v2)]
标题: 具有指令遵循能力的单细胞分析多模态人工智能副驾驶
标题: A Multi-Modal AI Copilot for Single-Cell Analysis with Instruction Following
摘要: 大型语言模型在解释复杂的自然语言指令方面表现出色,使其能够执行各种任务。 在生命科学领域,单细胞RNA测序(scRNA-seq)数据作为“细胞生物学的语言”,在单细胞水平上捕捉复杂的基因表达模式。 然而,通过传统工具与这种“语言”进行交互通常效率低下且不直观,给研究人员带来了挑战。 为解决这些限制,我们提出了InstructCell,这是一种多模态人工智能助手,利用自然语言作为更直接和灵活的单细胞分析媒介。 我们构建了一个全面的多模态指令数据集,将基于文本的指令与来自不同组织和物种的scRNA-seq图谱配对。 在此基础上,我们开发了一种多模态细胞语言架构,能够同时解释和处理两种模态。 InstructCell使研究人员能够使用简单的自然语言命令完成关键任务,如细胞类型注释、条件伪细胞生成和药物敏感性预测。 广泛的评估表明,InstructCell始终达到或超过现有单细胞基础模型的性能,同时适应多种实验条件。 更重要的是,InstructCell提供了一个易于使用且直观的工具,用于探索复杂的单细胞数据,降低技术门槛并促进更深入的生物学洞察。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.