Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > q-bio > arXiv:2504.03550

帮助 | 高级搜索

定量生物学 > 种群与进化

arXiv:2504.03550 (q-bio)
[提交于 2025年4月4日 ]

标题: 大规模流感突变数据集的k均值聚类降维

标题: Dimensionality reduction for k-means clustering of large-scale influenza mutation datasets

Authors:Emilee Walden, Jiahui Chen, Guo-Wei Wei
摘要: 病毒突变通过增加传染性、增强疫苗抗性和改变疾病严重程度,对公共健康构成重大威胁。 为了追踪这些不断演变的模式,像疾控中心(CDC)这样的机构每年评估数千种病毒株,强调了深入理解病毒突变和进化的迫切需求。 在这项研究中,我们整合了基因组分析、聚类以及三种领先的降维方法,即主成分分析(PCA)、t分布随机邻域嵌入(t-SNE)和统一流形近似与投影(UMAP),以调查COVID-19对流感病毒传播的影响。 通过对广泛的疫情前和疫情后流感数据集应用这些方法,我们揭示了疫情期间的选择压力如何影响流感遗传的多样性。 我们的研究结果显示,结合强大的降维与聚类可以提供关于病毒突变复杂动态的关键见解,为未来的科研方向及公共卫生干预策略提供指导。
摘要: Viral mutations pose significant threats to public health by increasing infectivity, strengthening vaccine resistance, and altering disease severity. To track these evolving patterns, agencies like the CDC annually evaluate thousands of virus strains, underscoring the urgent need to understand viral mutagenesis and evolution in depth. In this study, we integrate genomic analysis, clustering, and three leading dimensionality reduction approaches, namely, principal component analysis (PCA), t-distributed stochastic neighbor embedding (t-SNE), and uniform manifold approximation and projection (UMAP)-to investigate the effects of COVID-19 on influenza virus propagation. By applying these methods to extensive pre- and post-pandemic influenza datasets, we reveal how selective pressures during the pandemic have influenced the diversity of influenza genetics. Our findings indicate that combining robust dimension reduction with clustering yields critical insights into the complex dynamics of viral mutation, informing both future research directions and strategies for public health intervention.
主题: 种群与进化 (q-bio.PE) ; 基因组学 (q-bio.GN)
引用方式: arXiv:2504.03550 [q-bio.PE]
  (或者 arXiv:2504.03550v1 [q-bio.PE] 对于此版本)
  https://doi.org/10.48550/arXiv.2504.03550
通过 DataCite 发表的 arXiv DOI

提交历史

来自: Jiahui Chen [查看电子邮件]
[v1] 星期五, 2025 年 4 月 4 日 15:57:48 UTC (1,755 KB)
全文链接:

获取论文:

    查看标题为《》的 PDF
  • 查看中文 PDF
  • 查看 PDF
  • HTML(实验性)
  • TeX 源代码
  • 其他格式
许可图标 查看许可
当前浏览上下文:
q-bio.PE
< 上一篇   |   下一篇 >
新的 | 最近的 | 2025-04
切换浏览方式为:
q-bio
q-bio.GN

参考文献与引用

  • NASA ADS
  • 谷歌学术搜索
  • 语义学者
a 导出 BibTeX 引用 加载中...

BibTeX 格式的引用

×
数据由提供:

收藏

BibSonomy logo Reddit logo

文献和引用工具

文献资源探索 (什么是资源探索?)
连接的论文 (什么是连接的论文?)
Litmaps (什么是 Litmaps?)
scite 智能引用 (什么是智能引用?)

与本文相关的代码,数据和媒体

alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)

演示

复制 (什么是复制?)
Hugging Face Spaces (什么是 Spaces?)
TXYZ.AI (什么是 TXYZ.AI?)

推荐器和搜索工具

影响之花 (什么是影响之花?)
核心推荐器 (什么是核心?)
IArxiv 推荐器 (什么是 IArxiv?)
  • 作者
  • 地点
  • 机构
  • 主题

arXivLabs:与社区合作伙伴的实验项目

arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。

与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。

有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.

这篇论文的哪些作者是支持者? | 禁用 MathJax (什么是 MathJax?)
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号