定量生物学 > 基因组学
[提交于 2016年2月9日
]
标题: RECKONER:基于KMC的读取错误校正器
标题: RECKONER: Read Error Corrector Based on KMC
摘要: 动机:下一代测序工具已使以低成本产生大量基因组信息成为可能。 不幸的是,此类数据中存在测序错误会影响后续分析的质量。 可以通过执行错误校正来提高它们的准确性。 由于此类数据量巨大,校正算法必须:快速、内存节约,并为各种大小的生物体提供高精度的错误检测和消除。 结果:我们引入了一种新的基因组数据校正算法,能够在16核CPU上使用不到4GB的RAM,在不到40分钟内处理真核生物300Mbp基因组大小的高错误率数据。 该算法能够以优于或与竞争对手相当的水平校正测序数据。 这是通过使用非常强大的KMC~2$k$-mer计数器、基于$k$-mer计数和FASTQ质量指标的错误区域校正新方法以及仔细优化实现的。 可用性:程序可在http://sun.aei.posl.pl/REFRESH/reckoner免费获得。 联系人:sebastian.deorowicz@polsl.pl
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.