Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > q-bio > arXiv:2501.04413

帮助 | 高级搜索

定量生物学 > 定量方法

arXiv:2501.04413 (q-bio)
[提交于 2025年1月8日 ]

标题: 机器学习和统计分类的CRISPR-Cas12a诊断检测

标题: Machine Learning and statistical classification of CRISPR-Cas12a diagnostic assays

Authors:Nathan Khosla, Jake M. Lesinski, Marcus Haywood-Alexander, Andrew J. deMello, Daniel A. Richards
摘要: 基于CRISPR的诊断方法因其能够克服当前分子诊断测试的局限性,作为生物传感工具正受到越来越多的关注。 为了最大化基于CRISPR的检测方法的性能,大量努力集中在优化生物传感反应的化学和生物学方面。 然而,对改进用于分析基于CRISPR的诊断数据的技术关注较少。 到目前为止,诊断决策通常涉及各种形式的基于斜率的分类方法。 这些方法优于基于评估绝对信号的传统方法,但仍存在局限性。 在此,我们使用常见的基于斜率的方法建立了性能基准(总准确率、灵敏度和特异性)。 我们将这些基准方法的性能与三种不同的二次经验分布函数统计检验方法进行了比较,发现应用于临床数据集时,诊断速度和准确性有显著提高。 三种统计技术中的两种,Kolmogorov-Smirnov检验和Anderson-Darling检验,在结果时间最短和总测试准确率最高方面表现最佳。 此外,我们开发了一个长短期记忆循环神经网络来分类基于CRISPR的生物传感数据,在我们的模型数据集上实现了100%的特异性。 最后,我们提供了关于选择最适合诊断检测需求的分类方法和分类方法参数的指南。
摘要: CRISPR-based diagnostics have gained increasing attention as biosensing tools able to address limitations in contemporary molecular diagnostic tests. To maximise the performance of CRISPR-based assays, much effort has focused on optimizing the chemistry and biology of the biosensing reaction. However, less attention has been paid to improving the techniques used to analyse CRISPR-based diagnostic data. To date, diagnostic decisions typically involve various forms of slope-based classification. Such methods are superior to traditional methods based on assessing absolute signals, but still have limitations. Herein, we establish performance benchmarks (total accuracy, sensitivity, and specificity) using common slope-based methods. We compare the performance of these benchmark methods with three different quadratic empirical distribution function statistical tests, finding significant improvements in diagnostic speed and accuracy when applied to a clinical data set. Two of the three statistical techniques, the Kolmogorov-Smirnov and Anderson-Darling tests, report the lowest time-to-result and highest total test accuracy. Furthermore, we developed a long short-term memory recurrent neural network to classify CRISPR-biosensing data, achieving 100% specificity on our model data set. Finally, we provide guidelines on choosing the classification method and classification method parameters that best suit a diagnostic assays needs.
评论: 25页,5图,研究论文。Nathan Khosla和Jake M. Lesinski贡献相同。附有电子支持信息作为附录
主题: 定量方法 (q-bio.QM) ; 机器学习 (cs.LG)
引用方式: arXiv:2501.04413 [q-bio.QM]
  (或者 arXiv:2501.04413v1 [q-bio.QM] 对于此版本)
  https://doi.org/10.48550/arXiv.2501.04413
通过 DataCite 发表的 arXiv DOI

提交历史

来自: Daniel Richards Dr [查看电子邮件]
[v1] 星期三, 2025 年 1 月 8 日 10:59:36 UTC (19,075 KB)
全文链接:

获取论文:

    查看标题为《》的 PDF
  • 查看中文 PDF
  • 查看 PDF
  • 其他格式
许可图标 查看许可
当前浏览上下文:
q-bio.QM
< 上一篇   |   下一篇 >
新的 | 最近的 | 2025-01
切换浏览方式为:
cs
cs.LG
q-bio

参考文献与引用

  • NASA ADS
  • 谷歌学术搜索
  • 语义学者
a 导出 BibTeX 引用 加载中...

BibTeX 格式的引用

×
数据由提供:

收藏

BibSonomy logo Reddit logo

文献和引用工具

文献资源探索 (什么是资源探索?)
连接的论文 (什么是连接的论文?)
Litmaps (什么是 Litmaps?)
scite 智能引用 (什么是智能引用?)

与本文相关的代码,数据和媒体

alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)

演示

复制 (什么是复制?)
Hugging Face Spaces (什么是 Spaces?)
TXYZ.AI (什么是 TXYZ.AI?)

推荐器和搜索工具

影响之花 (什么是影响之花?)
核心推荐器 (什么是核心?)
IArxiv 推荐器 (什么是 IArxiv?)
  • 作者
  • 地点
  • 机构
  • 主题

arXivLabs:与社区合作伙伴的实验项目

arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。

与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。

有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.

这篇论文的哪些作者是支持者? | 禁用 MathJax (什么是 MathJax?)
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号