Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > stat > arXiv:2507.00952

帮助 | 高级搜索

统计学 > 计算

arXiv:2507.00952 (stat)
[提交于 2025年7月1日 ]

标题: 面向移动电话跟踪数据的数据处理流程

标题: Toward a Data Processing Pipeline for Mobile-Phone Tracking Data

Authors:Marcin Jurek, Catherine A. Calder, Corwin Zigler, Bethany Boettner, Christopher R. Browning
摘要: 随着手机变得无处不在,高频的智能手机定位数据正被越来越多的研究人员用于研究个人在日常生活中移动模式及其对健康、行为和其他结果的影响。 一个复杂的数据显示管道支撑着利用手机追踪数据的实证研究。 该管道的一个关键组成部分是将原始的时间戳位置转换为可分析的数据对象,通常是时空“轨迹”。 在本文中,我们分解了支撑青少年健康与发展的背景(AHDC)研究的数据分析管道的关键部分,这是一项针对居住在俄亥俄州哥伦布市大都会区的青少年的大规模纵向研究。 认识到AHDC研究人员使用的定制“分箱算法”类似于时间序列过滤算法,我们提出了一种统计框架——一种受分箱算法启发的形式化概率模型和计算推理方法,用于将噪声时间戳地理定位观测转换为捕捉旅行和稳定时期的移动轨迹。 我们的框架不同于分箱算法,它可以通过粒子吉布斯算法进行正式平滑,与原始分箱算法相比,提高了轨迹估计的准确性。 我们认为,我们的框架可以作为未来手机追踪研究的默认数据处理工具。
摘要: As mobile phones become ubiquitous, high-frequency smartphone positioning data are increasingly being used by researchers studying the mobility patterns of individuals as they go about their daily routines and the consequences of these patterns for health, behavioral, and other outcomes. A complex data pipeline underlies empirical research leveraging mobile phone tracking data. A key component of this pipeline is transforming raw, time-stamped positions into analysis-ready data objects, typically space-time "trajectories." In this paper, we break down a key portion of the data analysis pipeline underlying the Adolescent Health and Development in Context (AHDC) Study, a large-scale, longitudinal study of youth residing in the Columbus, OH metropolitan area. Recognizing that the bespoke "binning algorithm" used by AHDC researchers resembles a time-series filtering algorithm, we propose a statistical framework - a formal probability model and computational approach to inference - inspired by the binning algorithm for transforming noisy, time-stamped geographic positioning observations into mobility trajectories that capture periods of travel and stability. Our framework, unlike the binning algorithm, allows for formal smoothing via a particle Gibbs algorithm, improving estimation of trajectories as compared to the original binning algorithm. We argue that our framework can be used as a default data processing tool for future mobile-phone tracking studies.
主题: 计算 (stat.CO) ; 应用 (stat.AP)
引用方式: arXiv:2507.00952 [stat.CO]
  (或者 arXiv:2507.00952v1 [stat.CO] 对于此版本)
  https://doi.org/10.48550/arXiv.2507.00952
通过 DataCite 发表的 arXiv DOI(待注册)

提交历史

来自: Marcin Jurek [查看电子邮件]
[v1] 星期二, 2025 年 7 月 1 日 16:55:50 UTC (1,234 KB)
全文链接:

获取论文:

    查看标题为《》的 PDF
  • 查看中文 PDF
  • 查看 PDF
  • HTML(实验性)
  • TeX 源代码
  • 其他格式
查看许可
附属文件链接:

附属文件 (详细信息):

当前浏览上下文:
stat.CO
< 上一篇   |   下一篇 >
新的 | 最近的 | 2025-07
切换浏览方式为:
stat
stat.AP

参考文献与引用

  • NASA ADS
  • 谷歌学术搜索
  • 语义学者
a 导出 BibTeX 引用 加载中...

BibTeX 格式的引用

×
数据由提供:

收藏

BibSonomy logo Reddit logo

文献和引用工具

文献资源探索 (什么是资源探索?)
连接的论文 (什么是连接的论文?)
Litmaps (什么是 Litmaps?)
scite 智能引用 (什么是智能引用?)

与本文相关的代码,数据和媒体

alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)

演示

复制 (什么是复制?)
Hugging Face Spaces (什么是 Spaces?)
TXYZ.AI (什么是 TXYZ.AI?)

推荐器和搜索工具

影响之花 (什么是影响之花?)
核心推荐器 (什么是核心?)
IArxiv 推荐器 (什么是 IArxiv?)
  • 作者
  • 地点
  • 机构
  • 主题

arXivLabs:与社区合作伙伴的实验项目

arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。

与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。

有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.

这篇论文的哪些作者是支持者? | 禁用 MathJax (什么是 MathJax?)
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号