Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > cs > arXiv:2507.16497

帮助 | 高级搜索

计算机科学 > 机器学习

arXiv:2507.16497 (cs)
[提交于 2025年7月22日 ]

标题: 多变量时间序列聚类验证的典型相关模式

标题: Canonical Correlation Patterns for Validating Clustering of Multivariate Time Series

Authors:Isabella Degen, Zahraa S Abdallah, Kate Robson Brown, Henry W J Reeve
摘要: 基于相关性的多变量时间序列聚类方法揭示了健康、金融和工业应用中变量之间关系的制度变化。 然而,验证发现的聚类是否代表不同的关系而非任意分组仍然是一个基本挑战。 现有的聚类有效性指数是为欧几里得数据开发的,它们在相关模式中的有效性尚未经过系统评估。 与欧几里得聚类不同,欧几里得聚类中几何形状提供了离散的参考目标,而相关性存在于连续空间中,没有等效的参考模式。 我们通过引入数学定义的典型相关模式作为验证目标来填补这一验证空白,这些目标将无限的相关空间离散化为有限且可解释的参考模式。 使用在受控条件下具有完美真实标签的合成数据集,我们证明典型模式提供了可靠的验证目标,其中L1范数用于映射,L5范数用于轮廓宽度准则和Davies-Bouldin指数表现出优越性能。 这些方法对分布偏移具有鲁棒性,并能正确检测相关结构退化,从而提供实际实施指南。 这项工作为高风险领域中的严格相关性聚类验证建立了方法基础。
摘要: Clustering of multivariate time series using correlation-based methods reveals regime changes in relationships between variables across health, finance, and industrial applications. However, validating whether discovered clusters represent distinct relationships rather than arbitrary groupings remains a fundamental challenge. Existing clustering validity indices were developed for Euclidean data, and their effectiveness for correlation patterns has not been systematically evaluated. Unlike Euclidean clustering, where geometric shapes provide discrete reference targets, correlations exist in continuous space without equivalent reference patterns. We address this validation gap by introducing canonical correlation patterns as mathematically defined validation targets that discretise the infinite correlation space into finite, interpretable reference patterns. Using synthetic datasets with perfect ground truth across controlled conditions, we demonstrate that canonical patterns provide reliable validation targets, with L1 norm for mapping and L5 norm for silhouette width criterion and Davies-Bouldin index showing superior performance. These methods are robust to distribution shifts and appropriately detect correlation structure degradation, enabling practical implementation guidelines. This work establishes a methodological foundation for rigorous correlation-based clustering validation in high-stakes domains.
评论: 45页,8张图。介绍典型相关模式作为基于相关性的聚类的离散验证目标,系统评估距离函数和有效性指数,并通过具有合成真实数据的控制实验提供实际实现指南
主题: 机器学习 (cs.LG) ; 应用 (stat.AP)
MSC 类: 62H30 (Primary), 62M10 (Secondary)
ACM 类: I.5.3; I.6.4
引用方式: arXiv:2507.16497 [cs.LG]
  (或者 arXiv:2507.16497v1 [cs.LG] 对于此版本)
  https://doi.org/10.48550/arXiv.2507.16497
通过 DataCite 发表的 arXiv DOI(待注册)

提交历史

来自: Isabella Degen [查看电子邮件]
[v1] 星期二, 2025 年 7 月 22 日 11:51:48 UTC (10,342 KB)
全文链接:

获取论文:

    查看标题为《》的 PDF
  • 查看中文 PDF
  • 查看 PDF
  • TeX 源代码
  • 其他格式
查看许可
当前浏览上下文:
cs.LG
< 上一篇   |   下一篇 >
新的 | 最近的 | 2025-07
切换浏览方式为:
cs
stat
stat.AP

参考文献与引用

  • NASA ADS
  • 谷歌学术搜索
  • 语义学者
a 导出 BibTeX 引用 加载中...

BibTeX 格式的引用

×
数据由提供:

收藏

BibSonomy logo Reddit logo

文献和引用工具

文献资源探索 (什么是资源探索?)
连接的论文 (什么是连接的论文?)
Litmaps (什么是 Litmaps?)
scite 智能引用 (什么是智能引用?)

与本文相关的代码,数据和媒体

alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)

演示

复制 (什么是复制?)
Hugging Face Spaces (什么是 Spaces?)
TXYZ.AI (什么是 TXYZ.AI?)

推荐器和搜索工具

影响之花 (什么是影响之花?)
核心推荐器 (什么是核心?)
IArxiv 推荐器 (什么是 IArxiv?)
  • 作者
  • 地点
  • 机构
  • 主题

arXivLabs:与社区合作伙伴的实验项目

arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。

与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。

有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.

这篇论文的哪些作者是支持者? | 禁用 MathJax (什么是 MathJax?)
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号