计算机科学 > 机器学习
[提交于 2012年8月20日
]
标题: 通过投票的半监督聚类集成
标题: Semi-supervised Clustering Ensemble by Voting
摘要: 聚类集成是无监督学习中最近的进展之一。 它的目标是结合使用不同算法或同一聚类算法对同一数据集的不同运行所得的聚类结果,这是通过共识函数来完成的,该方法的效率和准确性已在文献中的许多工作中得到证明。 在本文的第一部分,我们对文献中当前的聚类集成方法进行了比较。 所有这些方法都包括两个主要步骤:集成生成和共识函数。 在论文的第二部分,我们建议在聚类集成过程中引入监督以获得更好的聚类结果。 监督可以应用在两个地方:要么是在聚类集成生成步骤中使用半监督算法,要么是以反馈的形式由共识函数阶段使用。 此外,我们引入了一种灵活的两参数加权机制,第一个参数描述了研究的数据集与用于生成基础划分的半监督聚类算法之间的兼容性,第二个参数用于向用户提供关于这些划分的反馈。 这两个参数参与基于“重新标记和投票”的共识函数以生成最终的聚类。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.