Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > cs > arXiv:2502.01435

帮助 | 高级搜索

计算机科学 > 数据结构与算法

arXiv:2502.01435 (cs)
[提交于 2025年2月3日 ]

标题: 密集子图发现与强三元闭包相结合

标题: Dense Subgraph Discovery Meets Strong Triadic Closure

Authors:Chamalee Wickrama Arachchi, Iiro Kumpulainen, Nikolaj Tatti
摘要: 寻找密集子图是一个核心问题,具有许多图挖掘应用,如社交网络中的社区检测和异常检测。 然而,在许多现实世界的网络中,连接并不相等。 一种将边标记为强边或弱边的方法是使用强三元闭包(STC)。 在此,如果一个节点与另外两个节点有强连接,那么那两个节点至少应有一条弱边连接。 STC标记不是唯一的,找到最大数量的强边是NP难的。 在本文中,我们将STC应用于密集子图发现。 更正式地说,我们对给定子图的评分是强边和弱边数量之和,由用户参数$\lambda$加权,与子图的节点数的比值。 我们的目标是找到一个子图和一个STC标记,使评分最大化。 我们证明,对于$\lambda = 1$,我们的问题等价于寻找最密集的子图,而对于$\lambda = 0$,我们的问题等价于寻找最大的团,使我们的问题NP难。 我们提出了一种基于整数线性规划的精确算法和四种实际的多项式时间启发式算法。 我们进行了一项广泛的实验研究,结果表明,我们的算法可以在合成数据集中找到真实情况,并在现实世界数据集中高效运行。
摘要: Finding dense subgraphs is a core problem with numerous graph mining applications such as community detection in social networks and anomaly detection. However, in many real-world networks connections are not equal. One way to label edges as either strong or weak is to use strong triadic closure~(STC). Here, if one node connects strongly with two other nodes, then those two nodes should be connected at least with a weak edge. STC-labelings are not unique and finding the maximum number of strong edges is NP-hard. In this paper, we apply STC to dense subgraph discovery. More formally, our score for a given subgraph is the ratio between the sum of the number of strong edges and weak edges, weighted by a user parameter $\lambda$, and the number of nodes of the subgraph. Our goal is to find a subgraph and an STC-labeling maximizing the score. We show that for $\lambda = 1$, our problem is equivalent to finding the densest subgraph, while for $\lambda = 0$, our problem is equivalent to finding the largest clique, making our problem NP-hard. We propose an exact algorithm based on integer linear programming and four practical polynomial-time heuristics. We present an extensive experimental study that shows that our algorithms can find the ground truth in synthetic datasets and run efficiently in real-world datasets.
主题: 数据结构与算法 (cs.DS)
引用方式: arXiv:2502.01435 [cs.DS]
  (或者 arXiv:2502.01435v1 [cs.DS] 对于此版本)
  https://doi.org/10.48550/arXiv.2502.01435
通过 DataCite 发表的 arXiv DOI
相关 DOI: https://doi.org/10.1145/3637528.367169
链接到相关资源的 DOI

提交历史

来自: Chamalee Wickrama Arachchi [查看电子邮件]
[v1] 星期一, 2025 年 2 月 3 日 15:18:18 UTC (106 KB)
全文链接:

获取论文:

    查看标题为《》的 PDF
  • 查看中文 PDF
  • 查看 PDF
  • TeX 源代码
  • 其他格式
许可图标 查看许可
当前浏览上下文:
cs
< 上一篇   |   下一篇 >
新的 | 最近的 | 2025-02
切换浏览方式为:
cs.DS

参考文献与引用

  • NASA ADS
  • 谷歌学术搜索
  • 语义学者
a 导出 BibTeX 引用 加载中...

BibTeX 格式的引用

×
数据由提供:

收藏

BibSonomy logo Reddit logo

文献和引用工具

文献资源探索 (什么是资源探索?)
连接的论文 (什么是连接的论文?)
Litmaps (什么是 Litmaps?)
scite 智能引用 (什么是智能引用?)

与本文相关的代码,数据和媒体

alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)

演示

复制 (什么是复制?)
Hugging Face Spaces (什么是 Spaces?)
TXYZ.AI (什么是 TXYZ.AI?)

推荐器和搜索工具

影响之花 (什么是影响之花?)
核心推荐器 (什么是核心?)
IArxiv 推荐器 (什么是 IArxiv?)
  • 作者
  • 地点
  • 机构
  • 主题

arXivLabs:与社区合作伙伴的实验项目

arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。

与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。

有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.

这篇论文的哪些作者是支持者? | 禁用 MathJax (什么是 MathJax?)
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号