Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > stat > arXiv:2507.11313v1

帮助 | 高级搜索

统计学 > 方法论

arXiv:2507.11313v1 (stat)
[提交于 2025年7月15日 ]

标题: 带有变薄距离的树推断

标题: Tree inference with varifold distances

Authors:Elodie Maignant, Tim Conrad, Christoph von Tycowicz
摘要: 在本文中,我们考虑了一个树推断问题,该问题受到单细胞基因组学中关键问题的启发,即从测序数据中重建动态细胞过程。 特别是,给定从该过程中采样的细胞群体,我们感兴趣的是根据细胞在该过程中的进展对细胞进行排序的问题。 这被称为轨迹推断。 如果该过程是分化过程,这就相当于重建相应的分化树。 在实践中,一种实现方法是基于测序数据中观察到的细胞相似性来估计节点之间的最短路径距离。 最近的测序技术使得测量两种类型的数据成为可能:基因表达水平,以及RNA速度,这是一种预测基因表达变化的向量。 然后数据由一个离散的向量场组成,该向量场位于维度等于所考虑基因数量的欧几里得空间(或其子集)上。 通过整合这个速度场,我们追踪每个单细胞从某个初始阶段到当前阶段的基因表达水平的变化。 最终,我们假设在欧几里得空间中存在一个忠实的分化树嵌入,但我们只能通过从根到节点的路径曲线来观察它。 利用这些曲线之间的变面距离,我们定义了节点之间的相似性度量,并证明该度量近似于与目标树同构的树中的最短路径距离。
摘要: In this paper, we consider a tree inference problem motivated by the critical problem in single-cell genomics of reconstructing dynamic cellular processes from sequencing data. In particular, given a population of cells sampled from such a process, we are interested in the problem of ordering the cells according to their progression in the process. This is known as trajectory inference. If the process is differentiation, this amounts to reconstructing the corresponding differentiation tree. One way of doing this in practice is to estimate the shortest-path distance between nodes based on cell similarities observed in sequencing data. Recent sequencing techniques make it possible to measure two types of data: gene expression levels, and RNA velocity, a vector that predicts changes in gene expression. The data then consist of a discrete vector field on a (subset of a) Euclidean space of dimension equal to the number of genes under consideration. By integrating this velocity field, we trace the evolution of gene expression levels in each single cell from some initial stage to its current stage. Eventually, we assume that we have a faithful embedding of the differentiation tree in a Euclidean space, but which we only observe through the curves representing the paths from the root to the nodes. Using varifold distances between such curves, we define a similarity measure between nodes which we prove approximates the shortest-path distance in a tree that is isomorphic to the target tree.
主题: 方法论 (stat.ME) ; 微分几何 (math.DG); 基因组学 (q-bio.GN)
MSC 类: 05C05, 58A-XX, 92-08
引用方式: arXiv:2507.11313 [stat.ME]
  (或者 arXiv:2507.11313v1 [stat.ME] 对于此版本)
  https://doi.org/10.48550/arXiv.2507.11313
通过 DataCite 发表的 arXiv DOI(待注册)

提交历史

来自: Elodie Maignant [查看电子邮件]
[v1] 星期二, 2025 年 7 月 15 日 13:45:20 UTC (48 KB)
全文链接:

获取论文:

    查看标题为《》的 PDF
  • 查看中文 PDF
  • 查看 PDF
  • HTML(实验性)
  • TeX 源代码
  • 其他格式
许可图标 查看许可
当前浏览上下文:
stat.ME
< 上一篇   |   下一篇 >
新的 | 最近的 | 2025-07
切换浏览方式为:
math
math.DG
q-bio
q-bio.GN
stat

参考文献与引用

  • NASA ADS
  • 谷歌学术搜索
  • 语义学者
a 导出 BibTeX 引用 加载中...

BibTeX 格式的引用

×
数据由提供:

收藏

BibSonomy logo Reddit logo

文献和引用工具

文献资源探索 (什么是资源探索?)
连接的论文 (什么是连接的论文?)
Litmaps (什么是 Litmaps?)
scite 智能引用 (什么是智能引用?)

与本文相关的代码,数据和媒体

alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)

演示

复制 (什么是复制?)
Hugging Face Spaces (什么是 Spaces?)
TXYZ.AI (什么是 TXYZ.AI?)

推荐器和搜索工具

影响之花 (什么是影响之花?)
核心推荐器 (什么是核心?)
IArxiv 推荐器 (什么是 IArxiv?)
  • 作者
  • 地点
  • 机构
  • 主题

arXivLabs:与社区合作伙伴的实验项目

arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。

与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。

有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.

这篇论文的哪些作者是支持者? | 禁用 MathJax (什么是 MathJax?)
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号