计算机科学 > 分布式、并行与集群计算
[提交于 2024年6月18日
]
标题: 使用重放时钟追踪分布式算法
标题: Tracing Distributed Algorithms Using Replay Clocks
摘要: 在本论文中,我们引入了重放时钟(RepCl),一种新颖的时钟基础设施,使我们能够对分布式计算进行离线分析。 重放时钟结构提供了一种方法,可以按照实际发生的方式重放计算,并能有效表示并发事件。 它基于向量时钟(VC)和混合逻辑时钟(HLC)所引入的结构,结合它们的基础设施以提供高效的重放。 有了这样的时钟,用户可以在考虑多个执行路径的同时重放计算,并检查在存在并发事件的情况下潜在路径可能采取的约束违反和特性。 具体而言,如果事件 e 必须在 f 之前发生,则重放时钟必须确保 e 在 f 之前被重放。另一方面,如果 e 和 f 可以以任何顺序发生,重放不应强制它们之间的顺序。 我们证明,如果时钟在 1ms 内同步,RepCl 可以用少于四个整数实现,适用于各种系统参数的 64 个进程。 此外,RepCl 的开销(计算时间戳和消息大小)与时钟的大小成正比。 通过在自定义分布式系统和 NS-3(一个最先进的网络模拟器)中的模拟,我们确定了 RepCl 的预期开销。 我们还确定了用户如何识别 RepCl 的可行性区域,在该区域内可以进行完整的重放。 使用 RepCl,我们为分布式计算提供了一个跟踪器,允许任何使用 RepCl 的计算被高效地重放。 可视化功能使用户能够以在线方式分析特定属性和约束,并能够独立考虑并发路径。 可视化功能提供了每个进程的视图以及基于 RepCl 为每个事件记录的时间的整个计算的整体视图。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.