计算机科学 > 数据结构与算法
[提交于 2025年8月31日
]
标题: 超图流中的三角形计数:一种完整且实用的方法
标题: Triangle Counting in Hypergraph Streams: A Complete and Practical Approach
摘要: 在超图流中进行三角形计数,包括超顶点和超边三角形,是超图分析中的一个基本问题,具有广泛的应用。 然而,现有方法面临两个关键限制:(i) 对超顶点三角形结构的分类不完整,通常仅考虑内部或外部三角形;以及 (ii) 采样方案不够灵活,预先定义了采样的超边数量,在严格内存约束下由于超边大小高度可变而不切实际。 为了解决这些挑战,我们首先引入了超顶点三角形的完整分类,包括内部、混合和外部三角形。 基于此,我们开发了 HTCount,这是一种基于水库的算法,能够根据可用内存 M 动态调整样本大小。为了进一步提高内存利用率并减少估计误差,我们开发了 HTCount-P,这是一种基于分区的变体,能够自适应地将未使用的内存划分为独立的样本子集。 我们提供了所提出算法无偏性和方差界限的理论分析。 案例研究展示了我们的三角形结构在揭示有意义的交互模式方面的表达能力。 在现实世界超图上的大量实验表明,我们的算法在严格内存约束下都能实现高精度的三角形计数估计,相对误差比现有方法低 1 到 2 个数量级,并且保持了稳定的高吞吐量。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.