计算机科学 > 数据结构与算法
[提交于 2025年5月21日
]
标题: 有容量的公平范围聚类:难解性与近似算法
标题: Capacitated Fair-Range Clustering: Hardness and Approximation Algorithms
摘要: 容量公平范围 $k$-聚类通过引入容量约束和人口统计公平性,推广了经典的 $k$-聚类。 在此设置中,每个设施有一个容量限制,并可能属于一个或多个人口统计群体。 任务是选择$k$个设施作为中心,并将每个客户分配到一个中心,使得:($a$) 没有一个中心超过其容量,($b$) 从每个组中选择的中心数量位于指定的下限和上限之间(公平范围约束),并且 ($c$) 聚类成本(例如,$k$-中位数或$k$-均值)最小化。Thejaswi 等人的先前工作(KDD 2022)表明,满足公平范围约束是 NP 难的,使得该问题无法以任何多项式因子进行近似。我们通过证明即使公平范围约束可以轻松满足,不可近似性仍然存在,从而加强了这一结果,突显了聚类任务本身的内在计算复杂性。在标准复杂性假设下,我们表明,如果不彻底枚举设施集的所有$k$-子集,则不可能进行非平凡的近似。值得注意的是,我们的不可近似性结果甚至在树度量上以及当组的数量是设施集大小的对数时仍然成立。鉴于这些强有力的不可近似性结果,我们专注于一个更实际的场景,其中组的数量是常数。 在此情况下,我们设计了两种近似算法:($i$) 一个多项式时间$O(\log k)$- 和$O(\log^2 k)$-近似算法,用于$k$-中位数和$k$-均值目标,以及 ($ii$) 一个参数化为$k$的固定参数可解算法,分别实现$(3+\epsilon)$- 和$(9 + \epsilon)$-近似。 这些结果与无公平范围约束的容量聚类的最佳已知近似保证相匹配,并解决了Zang等人提出的一个开放问题。 (NeurIPS 2024).
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.