定量生物学 > 基因组学
[提交于 2025年7月9日
]
标题: 基因组的拓扑序列分析:类别方法
标题: Topological Sequence Analysis of Genomes: Category Approaches
摘要: 序列数据,如DNA、RNA和蛋白质序列,表现出复杂的多尺度结构,这对传统分析方法构成了重大挑战,特别是那些依赖于比对或纯统计表示的方法。 在本工作中,我们引入了基于类别的基因组拓扑序列分析(CTSA)。 CTSA将序列建模为分辨率范畴,通过范畴构造捕捉其层次结构。 然后从这种范畴表示中推导出子结构复形,并计算其持续同调性以提取多尺度拓扑特征。 我们的模型通过融入基于序列拓扑的结构化数学形式,区别于传统的无比对方法。 所产生的拓扑签名在各种任务中提供了有信息量的表示,包括SARS-CoV-2变体的系统发育分析和蛋白质-核酸结合亲和力的预测。 与六种最先进的方法进行了比较研究。 实验结果表明,CTSA在这些任务中表现出色且一致,表明其具有广泛的适用性和鲁棒性。 除了序列分析外,所提出的框架为范畴理论和同调理论在生物序列分析中的整合开辟了新的方向。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.