计算机科学 > 机器学习
[提交于 2025年9月2日
]
标题: 评估累积谱梯度作为复杂性度量
标题: Evaluating Cumulative Spectral Gradient as a Complexity Measure
摘要: 准确估计数据集复杂性对于评估和比较知识图谱(KGs)的链接预测模型至关重要。 累积谱梯度(CSG)指标是从谱聚类框架内类之间的概率发散中推导出的,被提出作为数据集复杂性的度量,它(1)随着类数自然扩展,(2)与下游分类性能有很强的相关性。 在本工作中,我们严格评估了CSG在标准知识图谱链接预测基准和多类尾部预测任务上的行为,使用两个控制其计算的关键参数,M,每个类的蒙特卡洛采样点数,和K,嵌入空间中的最近邻数。 与原始声明相反,我们发现(1)CSG对K的选择非常敏感,因此不会随着目标类数而自动扩展,(2)CSG值与均倒数排名(MRR)等现有性能指标的相关性很弱或没有相关性。 通过在FB15k 237、WN18RR和其他标准数据集上的实验,我们证明了CSG所声称的稳定性和泛化预测能力在链接预测设置中失效。 我们的结果突显了在KG链接预测评估中需要更稳健、与分类器无关的复杂性度量。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.