定量生物学 > 定量方法
[提交于 2021年8月7日
(v1)
,最后修订 2021年10月12日 (此版本, v5)]
标题: 基于k-mer的SARS-CoV-2变异体识别方法
标题: A k-mer Based Approach for SARS-CoV-2 Variant Identification
摘要: 随着新型冠状病毒(COVID-19)在全球的迅速传播及其持续变异,设计一个系统来识别不同的已知(和未知)SARS-CoV-2变种至关重要。 识别特定变种有助于了解和建模它们的传播模式,设计有效的缓解策略,并防止未来的爆发。 它在研究已知疫苗对每个变种的有效性以及建模突破性感染的可能性方面也起着关键作用。 众所周知,刺突蛋白包含了与冠状病毒变种相关的大部分信息/变异。 在本文中,我们使用刺突序列来对人类中的冠状病毒不同变种进行分类。 我们表明,保留氨基酸的顺序有助于底层分类器实现更好的性能。 我们还表明,仅使用少量训练样本($1\%$的数据)就可以训练我们的模型以超越基线算法。 最后,我们展示了在识别变种中起关键作用的不同氨基酸的重要性,以及它们如何与美国疾病控制与预防中心(CDC)报告的氨基酸相吻合。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.