统计学 > 机器学习
[提交于 2012年8月22日
]
标题: 时间上的主题建模非参数混合模型
标题: A non-parametric mixture model for topic modeling over time
摘要: 一个单一的、静态的主题模型,如潜在狄利克雷分布,不适合建模跨越长时间段的语料库,因为主题的流行度可能会随时间变化。 已经提出了许多包含时间因素的模型,但通常它们要么表现出有限的时间变化形式,要么需要计算成本高昂的推断方法。 在本文中,我们提出了非参数时间主题(npTOT),这是一种用于随时间变化的主题的模型,它允许无限数量的主题,并且在这些主题的流行度的时间变化上具有灵活的分布。 我们为所提出的模型开发了一个折叠吉布斯采样器,并在合成和真实文档集上与现有模型进行了比较。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.