定量生物学 > 定量方法
[提交于 2025年1月11日
]
标题: 无监督检测和新兴SARS-CoV-2变种的适应性估计。 应用于污水样本(ANRS0160)
标题: Unsupervised detection and fitness estimation of emerging SARS-CoV-2 variants. Application to wastewater samples (ANRS0160)
摘要: 在SARS-CoV-2大流行期间反复出现的变异株凸显了收集纵向基因组数据并开发基于时间序列分析的统计方法以早期检测新威胁谱系和估计其适应度的紧迫性。 大多数模型研究特定谱系随时间的流行程度,并需要将序列预先分类为谱系。 这一过程容易导致延迟和偏差。 最近,一些作者研究了突变随时间的流行程度,并采用了替代聚类方法,避免了特定谱系分类。 然而,上述大多数方法要么是非参数的,要么不适合池化数据,例如废水样本。 在此背景下,我们提出了一种替代的无监督方法,根据突变频率轨迹对突变进行聚类,并从池化突变流行度的时间序列数据中估计群体适应度。 我们的模型是观测计数数据和潜在群体分配的混合,并使用期望最大化算法进行模型选择和参数估计。 我们将该方法应用于2020年10月至2021年4月期间从法国污水处理厂收集的SARS-CoV-2测序数据时间序列,结果显示其能够无偏地根据突变属于B.1.160、Alpha、Beta、B.1.177变异株的概率对突变进行分组,并且每组的选择系数估计值与Nextstrain报告的法国病毒动态一致。 此外,我们的方法早在监督方法(跟踪特定突变随时间的变化)检测到Alpha变异株之前就将其识别为威胁,值得注意的是,由于是无监督的,它不需要任何关于突变集合的先验信息。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.