Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > cs > arXiv:2507.12583

帮助 | 高级搜索

计算机科学 > 机器学习

arXiv:2507.12583 (cs)
[提交于 2025年7月16日 ]

标题: 排序向量聚类:理论与应用

标题: Ranking Vectors Clustering: Theory and Applications

Authors:Ali Fattahi, Ali Eshragh, Babak Aslani, Meysam Rabiee
摘要: 我们研究聚类排名向量的问题,其中每个向量表示作为不同整数有序列表的偏好。 具体而言,我们专注于k中心点排名向量聚类问题(KRC),其目标是将一组排名向量划分为k个簇并确定每个簇的中心点。 与经典的k均值聚类(KMC)不同,KRC限制了观测值和中心点都为排名向量。 我们建立了KRC的NP难性并描述了其可行集。 对于单簇情况,我们推导出最优中心点的闭式解析解,该解可以在线性时间内计算。 为了解决KRC的计算挑战,我们开发了一种高效的近似算法KRCA,该算法迭代地改进来自KMC的初始解,称为基线解。 此外,我们在KRCA中引入了一种分支定界(BnB)算法,利用决策树框架来减少计算时间,同时引入一个控制参数以平衡解的质量和效率。 我们建立了KRCA和BnB的理论误差界限。 通过在合成和现实数据集上的大量数值实验,我们证明KRCA始终优于基线解,在快速计算时间下显著提高了解的质量。 这项工作突显了KRC在个性化和大规模决策中的实际意义,提供了可在未来研究中进一步构建的方法论进展和见解。
摘要: We study the problem of clustering ranking vectors, where each vector represents preferences as an ordered list of distinct integers. Specifically, we focus on the k-centroids ranking vectors clustering problem (KRC), which aims to partition a set of ranking vectors into k clusters and identify the centroid of each cluster. Unlike classical k-means clustering (KMC), KRC constrains both the observations and centroids to be ranking vectors. We establish the NP-hardness of KRC and characterize its feasible set. For the single-cluster case, we derive a closed-form analytical solution for the optimal centroid, which can be computed in linear time. To address the computational challenges of KRC, we develop an efficient approximation algorithm, KRCA, which iteratively refines initial solutions from KMC, referred to as the baseline solution. Additionally, we introduce a branch-and-bound (BnB) algorithm for efficient cluster reconstruction within KRCA, leveraging a decision tree framework to reduce computational time while incorporating a controlling parameter to balance solution quality and efficiency. We establish theoretical error bounds for KRCA and BnB. Through extensive numerical experiments on synthetic and real-world datasets, we demonstrate that KRCA consistently outperforms baseline solutions, delivering significant improvements in solution quality with fast computational times. This work highlights the practical significance of KRC for personalization and large-scale decision making, offering methodological advancements and insights that can be built upon in future studies.
主题: 机器学习 (cs.LG) ; 计算复杂性 (cs.CC); 应用 (stat.AP); 方法论 (stat.ME)
引用方式: arXiv:2507.12583 [cs.LG]
  (或者 arXiv:2507.12583v1 [cs.LG] 对于此版本)
  https://doi.org/10.48550/arXiv.2507.12583
通过 DataCite 发表的 arXiv DOI

提交历史

来自: Ali Eshragh [查看电子邮件]
[v1] 星期三, 2025 年 7 月 16 日 19:00:09 UTC (4,510 KB)
全文链接:

获取论文:

    查看标题为《》的 PDF
  • 查看中文 PDF
  • 查看 PDF
  • HTML(实验性)
  • TeX 源代码
  • 其他格式
许可图标 查看许可
当前浏览上下文:
cs.CC
< 上一篇   |   下一篇 >
新的 | 最近的 | 2025-07
切换浏览方式为:
cs
cs.LG
stat
stat.AP
stat.ME

参考文献与引用

  • NASA ADS
  • 谷歌学术搜索
  • 语义学者
a 导出 BibTeX 引用 加载中...

BibTeX 格式的引用

×
数据由提供:

收藏

BibSonomy logo Reddit logo

文献和引用工具

文献资源探索 (什么是资源探索?)
连接的论文 (什么是连接的论文?)
Litmaps (什么是 Litmaps?)
scite 智能引用 (什么是智能引用?)

与本文相关的代码,数据和媒体

alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)

演示

复制 (什么是复制?)
Hugging Face Spaces (什么是 Spaces?)
TXYZ.AI (什么是 TXYZ.AI?)

推荐器和搜索工具

影响之花 (什么是影响之花?)
核心推荐器 (什么是核心?)
IArxiv 推荐器 (什么是 IArxiv?)
  • 作者
  • 地点
  • 机构
  • 主题

arXivLabs:与社区合作伙伴的实验项目

arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。

与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。

有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.

这篇论文的哪些作者是支持者? | 禁用 MathJax (什么是 MathJax?)
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号