计算机科学 > 社会与信息网络
[提交于 2015年6月8日
]
标题: SEISMIC:一种用于预测微博热度的自激发点过程模型
标题: SEISMIC: A Self-Exciting Point Process Model for Predicting Tweet Popularity
摘要: 社交网络网站允许用户创建和分享内容。这些网站的用户通过与朋友和关注者分享他人的帖子,可以形成大规模的信息级联。理解这种级联行为的核心挑战之一是预测信息爆发,其中一条帖子通过许多用户的分享变得广受欢迎。在本文中,我们专注于预测给定帖子的最终分享数量。我们基于自激发点过程理论,开发了一个统计模型,使我们能够做出准确的预测。我们的模型不需要训练或昂贵的特征工程。它产生了一个简单且可高效计算的公式,使我们能够实时回答诸如以下问题:鉴于帖子到目前为止的分享历史,我们对其最终分享数量的当前估计是多少?该帖子的分享级联是否已经过了爆炸性增长的初始阶段?以及,哪些帖子将来会被最多地分享?我们使用一个月的完整推特数据验证了我们的模型,并展示了比现有方法在预测准确性上的显著提升。在仅观察一个小时后,我们的模型在预测平均信息级联的最终规模时仅有15%的相对误差。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.