定量生物学 > 基因组学
[提交于 2025年1月4日
(v1)
,最后修订 2025年2月12日 (此版本, v3)]
标题: $α$-卫星重复数组的起源来自线粒体分子化石——在核基因组中的顺序插入、扩展和进化
标题: Origin of $α$-satellite repeat arrays from mitochondrial molecular fossils -- sequential insertion, expansion, and evolution in the nuclear genome
摘要: α卫星DNA是由150-400 bp单元组成的大型串联数组,其起源仍然是一个进化之谜。 在这项研究中,我们在宝石小蜂Nasonia vitripennis的核基因组中鉴定出1,545个α卫星类似(SatL)重复单元。 其中,39个SatL拷贝在线粒体中组织成两个回文数组,导致基因组大小增加了50%。 值得注意的是,对1,516个核SatL重复的基因组邻域分析显示,它们位于NuMT(核线粒体DNA)区域,并且SatL系统发育与线粒体基因和NuMT假基因完美匹配。 这些结果支持SatL数组起源于过去50万年内,从其姐妹物种N. giraulti分化后,十次独立的线粒体插入事件进入核基因组。 显著的重复GC百分比升高(从33.9%到50.4%)是由于线粒体中两个线粒体SatL数组的回文序列配对促进了GC偏向的基因转换,这是SatL序列快速进化的一个标志。 核SatL重复数组经历了大量的拷贝数扩展,从12-15个(SatL1)到超过400个拷贝(SatL4)。 最古老的SatL4B数组由四种来自祖先重复AT丰富区删除的重复单元组成,并通过复制进化出了复杂的高级结构。 我们还发现了类似重复插入到Muscidifurax的核基因组中,这表明这种机制可能在昆虫中很常见。 这是首次报告核卫星序列的线粒体起源,我们的发现为卫星DNA的起源和进化提供了新的见解。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.