统计学 > 机器学习
[提交于 2025年6月24日
]
标题: 消费者行为的形状:时间序列的符号与拓扑分析
标题: The Shape of Consumer Behavior: A Symbolic and Topological Analysis of Time Series
摘要: 理解在线搜索行为中的时间模式对于实时营销和趋势预测至关重要。 Google Trends 为公众兴趣提供了丰富的代理数据,但其时间序列数据的高维度和噪声给有效的聚类带来了挑战。 本研究评估了三种无监督聚类方法,符号聚合近似(SAX)、增强型 SAX(eSAX)和拓扑数据分析(TDA),应用于代表主要消费者类别的 20 个 Google Trends 关键词。 我们的结果表明,尽管 SAX 和 eSAX 对于稳定的时间序列提供了快速且可解释的聚类,但它们在波动性和复杂性方面存在困难,常常产生模糊的“万能”聚类。 相比之下,TDA 通过持久同调捕捉全局结构特征,并实现了更平衡且有意义的分组。 我们最后提供了在消费者分析中使用符号和拓扑方法的实用指导,并建议结合这两种视角的混合方法在未来应用中具有强大的潜力。
当前浏览上下文:
stat.ML
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.