Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > q-bio > arXiv:2501.06548

帮助 | 高级搜索

定量生物学 > 定量方法

arXiv:2501.06548 (q-bio)
[提交于 2025年1月11日 ]

标题: 无监督检测和新兴SARS-CoV-2变种的适应性估计。 应用于污水样本(ANRS0160)

标题: Unsupervised detection and fitness estimation of emerging SARS-CoV-2 variants. Application to wastewater samples (ANRS0160)

Authors:Alexandra Lefebvre, Vincent Maréchal, Arnaud Gloaguen, Obépine Consortium, Amaury Lambert, Yvon Maday
摘要: 在SARS-CoV-2大流行期间反复出现的变异株凸显了收集纵向基因组数据并开发基于时间序列分析的统计方法以早期检测新威胁谱系和估计其适应度的紧迫性。 大多数模型研究特定谱系随时间的流行程度,并需要将序列预先分类为谱系。 这一过程容易导致延迟和偏差。 最近,一些作者研究了突变随时间的流行程度,并采用了替代聚类方法,避免了特定谱系分类。 然而,上述大多数方法要么是非参数的,要么不适合池化数据,例如废水样本。 在此背景下,我们提出了一种替代的无监督方法,根据突变频率轨迹对突变进行聚类,并从池化突变流行度的时间序列数据中估计群体适应度。 我们的模型是观测计数数据和潜在群体分配的混合,并使用期望最大化算法进行模型选择和参数估计。 我们将该方法应用于2020年10月至2021年4月期间从法国污水处理厂收集的SARS-CoV-2测序数据时间序列,结果显示其能够无偏地根据突变属于B.1.160、Alpha、Beta、B.1.177变异株的概率对突变进行分组,并且每组的选择系数估计值与Nextstrain报告的法国病毒动态一致。 此外,我们的方法早在监督方法(跟踪特定突变随时间的变化)检测到Alpha变异株之前就将其识别为威胁,值得注意的是,由于是无监督的,它不需要任何关于突变集合的先验信息。
摘要: Repeated waves of emerging variants during the SARS-CoV-2 pandemics have highlighted the urge of collecting longitudinal genomic data and developing statistical methods based on time series analyses for detecting new threatening lineages and estimating their fitness early in time. Most models study the evolution of the prevalence of particular lineages over time and require a prior classification of sequences into lineages. Such process is prone to induce delays and bias. More recently, few authors studied the evolution of the prevalence of mutations over time with alternative clustering approaches, avoiding specific lineage classification. Most of the aforementioned methods are however either non parametric or unsuited to pooled data characterizing, for instance, wastewater samples. In this context, we propose an alternative unsupervised method for clustering mutations according to their frequency trajectory over time and estimating group fitness from time series of pooled mutation prevalence data. Our model is a mixture of observed count data and latent group assignment and we use the expectation-maximization algorithm for model selection and parameter estimation. The application of our method to time series of SARS-CoV-2 sequencing data collected from wastewater treatment plants in France from October 2020 to April 2021 shows its ability to agnostically group mutations according to their probability of belonging to B.1.160, Alpha, Beta, B.1.177 variants with selection coefficient estimates per group in coherence with the viral dynamics in France reported by Nextstrain. Moreover, our method detected the Alpha variant as threatening as early as supervised methods (which track specific mutations over time) with the noticeable difference that, since unsupervised, it does not require any prior information on the set of mutations.
评论: 45页,19图和表
主题: 定量方法 (q-bio.QM)
MSC 类: 62P10 92D30
引用方式: arXiv:2501.06548 [q-bio.QM]
  (或者 arXiv:2501.06548v1 [q-bio.QM] 对于此版本)
  https://doi.org/10.48550/arXiv.2501.06548
通过 DataCite 发表的 arXiv DOI

提交历史

来自: Alexandra Lefebvre [查看电子邮件]
[v1] 星期六, 2025 年 1 月 11 日 14:02:25 UTC (687 KB)
全文链接:

获取论文:

    查看标题为《》的 PDF
  • 查看中文 PDF
  • 查看 PDF
  • HTML(实验性)
  • TeX 源代码
  • 其他格式
许可图标 查看许可
当前浏览上下文:
q-bio.QM
< 上一篇   |   下一篇 >
新的 | 最近的 | 2025-01
切换浏览方式为:
q-bio

参考文献与引用

  • NASA ADS
  • 谷歌学术搜索
  • 语义学者
a 导出 BibTeX 引用 加载中...

BibTeX 格式的引用

×
数据由提供:

收藏

BibSonomy logo Reddit logo

文献和引用工具

文献资源探索 (什么是资源探索?)
连接的论文 (什么是连接的论文?)
Litmaps (什么是 Litmaps?)
scite 智能引用 (什么是智能引用?)

与本文相关的代码,数据和媒体

alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)

演示

复制 (什么是复制?)
Hugging Face Spaces (什么是 Spaces?)
TXYZ.AI (什么是 TXYZ.AI?)

推荐器和搜索工具

影响之花 (什么是影响之花?)
核心推荐器 (什么是核心?)
IArxiv 推荐器 (什么是 IArxiv?)
  • 作者
  • 地点
  • 机构
  • 主题

arXivLabs:与社区合作伙伴的实验项目

arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。

与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。

有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.

这篇论文的哪些作者是支持者? | 禁用 MathJax (什么是 MathJax?)
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号