定量生物学 > 基因组学
[提交于 2018年3月2日
]
标题: 使用重组的数据驱动模型预测TCR库共享的光谱
标题: Predicting the spectrum of TCR repertoire sharing with a data-driven model of recombination
摘要: 尽管T细胞受体(TCR)库具有极高的多样性,但在大量个体小鼠和人类中发现了许多相同的TCR序列。 这些广泛共享的序列,通常被称为“公共”序列,被认为由于其潜在的免疫功能或通过V(D)J重组生成的容易性而被过度代表。 在这里,我们表明,即使对于大规模队列,个体之间TCR序列的共享程度也可以通过一个模型很好地预测,该模型考虑了生成过程中的已知定量统计偏差,以及一个简单的胸腺选择模型。 序列是否被多个个体共享被预测取决于查询的个体数量、采样深度以及序列本身,这与数据一致。 我们引入了在查询队列大小和采样库大小条件下的公共性程度。 基于这些观察,我们提出了一种公共/私有序列分类器,“PUBLIC”(Public Universal Binary Likelihood Inference Classifier),基于生成概率,即使在小队列规模下也能表现出色。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.