定量生物学 > 基因组学
[提交于 2025年10月4日
]
标题: RawBench:一种用于原始纳米孔信号分析技术的全面基准测试框架
标题: RawBench: A Comprehensive Benchmarking Framework for Raw Nanopore Signal Analysis Techniques
摘要: 纳米孔测序技术持续迅速发展,提供了实时分析、能够测序极长的DNA片段(单次读取可达数百万个碱基)以及在分子完成前选择性停止测序等关键优势。 传统上,测序过程中生成的原始电信号通过称为碱基识别的过程转换为DNA序列,这通常依赖于大型神经网络模型。 原始信号分析已成为这些资源密集型方法的有前途的替代方案。 虽然已经尝试对传统碱基识别方法进行基准测试,但现有的评估框架存在以下问题:1)忽略了原始信号分析技术,2)缺乏灵活容纳新原始信号分析工具的能力,3)未包含纳米孔数据集的最新改进。 我们的目标是提供一个可扩展的基准测试框架,以设计和比较新的原始信号分析方法。 为此,我们引入了RawBench,这是第一个用于评估原始纳米孔信号分析技术的灵活框架。 RawBench提供了对三个核心流程组件的模块化评估:1)参考基因组编码(使用不同的孔模型),2)信号编码(通过各种分割方法),3)表示匹配(通过不同的数据结构)。 我们从三个方面对原始信号分析技术进行了广泛评估:1)读取映射的质量和性能,2)读取分类的质量和性能,3)原始信号分析辅助的碱基识别质量。 我们的评估结果表明,原始信号分析可以在显著降低资源需求的同时实现具有竞争力的质量,特别是在需要实时处理或边缘部署的环境中。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.