定量生物学 > 基因组学
[提交于 2025年7月1日
]
标题: 基因表达分布偏移的建模用于未见的遗传扰动
标题: Modeling Gene Expression Distributional Shifts for Unseen Genetic Perturbations
摘要: 我们训练一个神经网络来预测基因表达在基因扰动后的分布响应。 这是一个在早期药物发现阶段的重要任务,因为这些响应可以提供关于基因功能的见解并指导靶点识别。 现有方法仅预测平均表达的变化,忽略了单细胞数据中固有的随机性。 相反,我们通过建模表达分布来提供更真实的细胞响应视图。 我们的模型根据扰动预测基因级别的直方图,并在以较少的训练成本捕捉高阶统计特性(如方差、偏度和峰度)方面优于基线方法。 为了推广到未见过的扰动,我们通过来自大型语言模型(LLMs)的基因嵌入来整合先验知识。 尽管建模了更丰富的输出空间,该方法在预测平均表达变化方面仍具有竞争力。 这项工作为更丰富且具有生物学信息的扰动效应模型提供了一个实用的步骤。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.