Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > cs > arXiv:2406.05439v1

帮助 | 高级搜索

计算机科学 > 人工智能

arXiv:2406.05439v1 (cs)
[提交于 2024年6月8日 ]

标题: 一种可扩展且接近最优的长轨迹一致性检查方法

标题: A Scalable and Near-Optimal Conformance Checking Approach for Long Traces

Authors:Eli Bogdanov, Izack Cohen, Avigdor Gal
摘要: 长轨迹和来自传感器及预测模型的大型事件日志在我们数据丰富的世界中变得越来越常见。 在这种情况下,符合性检查是流程挖掘中的关键任务,由于找到最佳对齐的指数复杂性,可能会变得计算上不可行。 本文介绍了一种新的滑动窗口方法,以解决这些可扩展性挑战,同时保持基于对齐方法的可解释性。 通过将轨迹分解为可管理的子轨迹,并迭代地将每个子轨迹与流程模型对齐,我们的方法显著减少了搜索空间。 该方法使用捕获轨迹和流程模型结构特性的全局信息来做出有根据的对齐决策,即使某些对齐对于局部子轨迹是最优的,也会丢弃那些没有前景的对齐。 这提高了结果的整体准确性。 实验评估表明,所提出的方法在大多数情况下能够持续找到最优对齐,并突出了其可扩展性。 这一结论进一步得到了理论复杂性分析的支持,该分析显示了与其它常见的符合性检查方法相比,搜索空间的增长有所减少。 这项工作为大规模流程挖掘应用中的高效符合性检查提供了有价值的贡献。
摘要: Long traces and large event logs that originate from sensors and prediction models are becoming more common in our data-rich world. In such circumstances, conformance checking, a key task in process mining, can become computationally infeasible due to the exponential complexity of finding an optimal alignment. This paper introduces a novel sliding window approach to address these scalability challenges while preserving the interpretability of alignment-based methods. By breaking down traces into manageable subtraces and iteratively aligning each with the process model, our method significantly reduces the search space. The approach uses global information that captures structural properties of the trace and the process model to make informed alignment decisions, discarding unpromising alignments even if they are optimal for a local subtrace. This improves the overall accuracy of the results. Experimental evaluations demonstrate that the proposed method consistently finds optimal alignments in most cases and highlight its scalability. This is further supported by a theoretical complexity analysis, which shows the reduced growth of the search space compared to other common conformance checking methods. This work provides a valuable contribution towards efficient conformance checking for large-scale process mining applications.
主题: 人工智能 (cs.AI) ; 数据库 (cs.DB)
引用方式: arXiv:2406.05439 [cs.AI]
  (或者 arXiv:2406.05439v1 [cs.AI] 对于此版本)
  https://doi.org/10.48550/arXiv.2406.05439
通过 DataCite 发表的 arXiv DOI

提交历史

来自: Izack Cohen [查看电子邮件]
[v1] 星期六, 2024 年 6 月 8 日 11:04:42 UTC (179 KB)
全文链接:

获取论文:

    查看标题为《》的 PDF
  • 查看中文 PDF
  • 查看 PDF
  • HTML(实验性)
  • TeX 源代码
  • 其他格式
查看许可
当前浏览上下文:
cs.AI
< 上一篇   |   下一篇 >
新的 | 最近的 | 2024-06
切换浏览方式为:
cs
cs.DB

参考文献与引用

  • NASA ADS
  • 谷歌学术搜索
  • 语义学者
a 导出 BibTeX 引用 加载中...

BibTeX 格式的引用

×
数据由提供:

收藏

BibSonomy logo Reddit logo

文献和引用工具

文献资源探索 (什么是资源探索?)
连接的论文 (什么是连接的论文?)
Litmaps (什么是 Litmaps?)
scite 智能引用 (什么是智能引用?)

与本文相关的代码,数据和媒体

alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)

演示

复制 (什么是复制?)
Hugging Face Spaces (什么是 Spaces?)
TXYZ.AI (什么是 TXYZ.AI?)

推荐器和搜索工具

影响之花 (什么是影响之花?)
核心推荐器 (什么是核心?)
IArxiv 推荐器 (什么是 IArxiv?)
  • 作者
  • 地点
  • 机构
  • 主题

arXivLabs:与社区合作伙伴的实验项目

arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。

与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。

有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.

这篇论文的哪些作者是支持者? | 禁用 MathJax (什么是 MathJax?)
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号