计算机科学 > 机器学习
[提交于 2025年7月11日
]
标题: MH-FSF:克服特征选择评估中基准测试和可重复性限制的统一框架
标题: MH-FSF: A Unified Framework for Overcoming Benchmarking and Reproducibility Limitations in Feature Selection Evaluation
摘要: 特征选择对于构建有效的预测模型至关重要,因为它可以降低维度并突出关键特征。 然而,当前的研究往往受到基准测试有限和依赖专有数据集的困扰。 这严重阻碍了可重复性,并可能对整体性能产生负面影响。 为解决这些限制,我们引入了MH-FSF框架,这是一个全面、模块化且可扩展的平台,旨在促进特征选择方法的再现和实现。 该框架通过协作研究开发,提供了17种方法(11种经典方法,6种领域特定方法)的实现,并能够在10个公开可用的安卓恶意软件数据集上进行系统评估。 我们的结果揭示了在平衡和不平衡数据集上的性能差异,突显了需要考虑这些不对称性的数据预处理和选择标准的重要性。 我们展示了统一平台在比较各种特征选择技术中的重要性,促进了方法的一致性和严谨性。 通过提供这个框架,我们的目标是显著拓宽现有的文献,并为特征选择领域的新的研究方向铺平道路,特别是在安卓恶意软件检测的背景下。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.