计算机科学 > 密码学与安全
[提交于 2025年7月14日
]
标题: SynthGuard:通过可扩展且隐私保护的工作流框架重新定义合成数据生成
标题: SynthGuard: Redefining Synthetic Data Generation with a Scalable and Privacy-Preserving Workflow Framework
摘要: 数据驱动的应用在医疗、金融和执法等领域的日益依赖凸显了对数据生成和共享的安全、隐私保护和可扩展机制的需求。 合成数据生成(SDG)已成为一种有前景的方法,但通常依赖于集中式或外部处理,引发了关于数据主权、领域所有权和符合不断变化的监管标准的担忧。 为解决这些问题,我们引入了SynthGuard,这是一个旨在通过使数据所有者能够控制SDG工作流来确保计算治理的框架。 SynthGuard支持模块化和隐私保护的工作流,确保在各种环境中的安全、可审计和可重复执行。 在本文中,我们展示了SynthGuard如何通过与数据主权和监管合规性要求相一致,解决领域特定需求和可扩展SDG之间的复杂性。 SynthGuard通过与领域专家的输入进行迭代开发,并通过实际用例进行了验证,证明了其在确保合规性的同时平衡安全性、隐私性和可扩展性的能力。 评估证实了其在实施和执行SDG工作流以及在各种计算环境中集成隐私和效用评估方面的有效性。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.