定量生物学 > 生物大分子
[提交于 2025年1月8日
]
标题: RNA类似基序的宇宙有多大? 使用拓扑描述符对RNA图基序进行聚类分析
标题: How Large is the Universe of RNA-Like Motifs? A Clustering Analysis of RNA Graph Motifs Using Topological Descriptors
摘要: 我们引入了一种基于计算拓扑的方法,结合无监督机器学习算法,以估计RNA类似图拓扑的数据库大小和内容。 具体来说,我们应用图论枚举法生成顶点数从2到9的所有110,667个可能的二维对偶图。 其中,只有0.11%的图通过RNA-as-Graphs(RAG)映射方法对应大约200,000个已知的RNA原子片段(收集于2021年)。 其余的99.89%的对偶图可能是RNA类似或非RNA类似。 为了确定这99.89%假设集中的哪些对偶图更可能与RNA结构相关,我们应用计算拓扑描述符,使用持久谱图(PSG)方法,通过19个基于PSG的特征来表征每个图,并使用聚类算法将所有可能的对偶图分为两个簇,RNA类似簇和非RNA类似簇。 每个对偶图到RNA类似簇中心的距离代表其属于RNA结构的可能性。 从验证结果来看,我们的基于PSG的RNA类似簇包括了121个已知RNA对偶图的97.3%,表明性能良好。 此外,46.017%的假设RNA被预测为RNA类似。 显著的是,我们观察到所有前15个RNA类似对偶图可以被分成多个子图,而前15个非RNA类似对偶图则倾向于没有任何子图。 此外,在比较它们的拓扑特征时,顶级RNA类似和非RNA类似图之间存在显著的拓扑差异。 这些发现为RNA基序宇宙的大小和RNA设计策略提供了有价值的见解,为预测RNA图拓扑提供了一个新的框架,并指导新型RNA基序的发现,也许通过子图组装发现抗病毒治疗药物。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.