计算机科学 > 机器学习
[提交于 2024年9月3日
]
标题: 从噪声分散数据中协同学习联邦模型
标题: Collaboratively Learning Federated Models from Noisy Decentralized Data
摘要: 联邦学习(FL)已成为一种突出的方法,用于使用边缘设备上的本地数据协作训练机器学习模型,同时保持数据的去中心化。 然而,在FL中考虑本地客户端贡献的数据质量仍然是一个关键挑战,因为本地数据往往容易受到各种噪声和扰动的影响,这会损害聚合过程并导致性能不佳的全局模型。 在本工作中,我们专注于解决输入空间中的噪声数据问题,这与标签噪声相比是一个研究不足的领域。 我们提出了一种基于在噪声和干净输入数据上训练的模型的梯度范数分布密度之间观察到的显著差异的客户端输入综合评估方法。 基于这一观察,我们引入了一种简单而有效的方法,在FL的初始阶段识别数据质量低的客户端。 此外,我们提出了一种感知噪声的FL聚合方法,即联邦噪声筛选(FedNS),该方法可以作为插件方法与广泛使用的FL策略结合使用。 我们在不同联邦设置下的多种基准数据集上进行了广泛的评估,证明了FedNS的有效性。 我们的方法可以轻松地与现有的FL策略集成,在从噪声去中心化数据学习时,使全局模型的性能在 IID 设置下提高高达 13.68%,在 non-IID 设置下提高高达 15.85%。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.