计算机科学 > 机器学习
[提交于 2025年1月4日
]
标题: 基于扩散模型的数据合成辅助联邦半监督学习
标题: Diffusion Model-Based Data Synthesis Aided Federated Semi-Supervised Learning
摘要: 联邦半监督学习(FSSL)主要受到两个因素的挑战:客户端之间标记数据的稀缺性以及客户端之间数据的非独立同分布(non-IID)特性。 在本文中,我们提出了一种新方法,基于扩散模型的数据合成辅助联邦半监督学习(DDSA-FSSL),该方法利用扩散模型(DM)生成合成数据,弥合异构本地数据分布与全局数据分布之间的差距。 在DDSA-FSSL中,客户端通过使用联邦学习训练的分类器对未标记数据进行伪标记,以解决标记数据稀缺的问题。 然后,使用标记数据和精度优化的伪标记数据协同训练DM,使客户端能够为在其标记数据集中缺失的类别生成合成样本。 此过程使客户端能够生成更全面的与全局分布一致的合成数据集。 在多个数据集和不同non-IID分布上进行的大量实验表明了DDSA-FSSL的有效性,例如,在具有10%标记数据的CIFAR-10数据集上,准确率从38.46%提高到了52.14%。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.