电气工程与系统科学 > 图像与视频处理
[提交于 2025年6月30日
]
标题: 手术视频中联邦仪器分割的时空表示解耦与增强
标题: Spatio-Temporal Representation Decoupling and Enhancement for Federated Instrument Segmentation in Surgical Videos
摘要: 外科器械分割在联邦学习(FL)下是一个有前景的方向,它使多个外科场所能够在不集中数据集的情况下协作训练模型。 然而,在外科数据科学中存在非常有限的FL工作,其他模态的FL方法并未考虑外科领域固有的特性:i)不同场景显示多样的解剖背景,而器械表示高度相似;ii)存在外科模拟器,可以以最小的努力促进大规模合成数据生成。 本文中,我们提出了一种新颖的个性化FL方案,时空表示解耦与增强(FedST),该方案在本地站点和全局服务器训练期间巧妙地利用外科领域知识以提高分割效果。 具体来说,我们的模型在本地站点训练中采用表示分离与合作(RSC)机制,将查询嵌入层解耦以进行私有训练,以编码各自的背景。 同时,其他参数在全球范围内优化,以捕捉器械的一致表示,包括时间层以捕捉相似的运动模式。 进一步设计了基于文本引导的通道选择,以突出站点特定特征,促进模型适应每个站点。 此外,在全局服务器训练中,我们提出了基于合成数据的显式表示量化(SERQ),该方法基于合成数据定义一个显式表示目标,以在融合期间同步模型收敛,从而提高模型泛化能力。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.