统计学 > 方法论
[提交于 2025年5月1日
]
标题: 多元保形选择
标题: Multivariate Conformal Selection
摘要: 从大型数据集中选择高质量候选者在药物发现、精准医疗和大规模语言模型(LLM)的对齐等应用中至关重要。虽然一致性选择(CS)提供了严格的不确定性量化,但它仅限于单变量响应和标量标准。为了解决这个问题,我们提出了多变量一致性选择(mCS),这是为多变量响应设置设计的CS的一般化。我们的方法引入了区域单调性,并使用多变量非一致性分数来构造一致性p值,从而实现有限样本下的假发现率(FDR)控制。我们介绍了两种变体:mCS-dist,使用基于距离的分数,以及mCS-learn,通过可微优化学习最优分数。在模拟和真实数据集上的实验表明,mCS显著提高了选择能力,同时保持了FDR控制,确立了它作为多变量选择任务的强大框架。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.