定量生物学 > 基因组学
[提交于 2025年10月13日
]
标题: 氯扫描:从宏基因组数据中恢复质体基因组片段
标题: ChloroScan: Recovering plastid genome bins from metagenomic data
摘要: 基因组解析的宏基因组学在发现原核生物基因组方面做出了重要贡献。 当应用于微小真核生物时,诸如核基因组中发现的内含子和重复区域数量较多等挑战,阻碍了新型原生生物谱系的挖掘和发现。 细胞器基因组更简单、更小、丰度更高,并包含有价值的系统发育信息,但尚未被广泛用于从宏基因组中识别新的原生生物谱系。 在这里,我们介绍了 “ChloroScan”,一种新的生物信息学流程,用于从宏基因组中提取真核生物叶绿体基因组。 它结合了一个深度学习的重叠群分类器来识别潜在的叶绿体重叠群,并有一个自动分箱模块,通过从经过整理的标记基因数据库中获得指导来恢复分箱。 此外, ChloroScan以多种用户友好的格式总结结果,包括每个分箱的注释编码序列和蛋白质。 我们表明,对于模拟的宏基因组,ChloroScan比MetaBAT2恢复了更多高质量的叶绿体分箱。 ChloroScan的实际用途通过从四个原生生物大小分馏的宏基因组中恢复16个中等至高质量的宏基因组组装基因组得到说明,其中一些分箱显示出高度的分类新颖性。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.