计算机科学 > 计算机视觉与模式识别
[提交于 2025年4月16日
]
标题: 基于物理启发表示学习的复值SAR基础模型
标题: A Complex-valued SAR Foundation Model Based on Physically Inspired Representation Learning
摘要: 视觉基础模型在遥感领域已被广泛研究,因为它们在各种下游任务中表现出优越的泛化能力。 合成孔径雷达(SAR)提供了全天候成像能力,为地球观测提供了显著优势。 然而,建立用于SAR图像解释的基础模型不可避免地会遇到信息利用不足和可解释性差的挑战。 在本文中,我们提出了一种基于复数SAR数据的遥感基础模型,该模型模拟极化分解过程进行预训练,即通过散射基和散射系数的加权组合来表征像素散射强度,从而赋予基础模型物理可解释性。 具体而言,我们构建了一系列散射查询,每个查询代表一个独立且有意义的散射基,这些查询与散射查询解码器中的SAR特征交互,并输出相应的散射系数。 为了引导预训练过程,构建了极化分解损失和功率自监督损失。前者将预测的系数与Yamaguchi系数对齐,后者则从预测的系数中重建功率并将其与输入图像的功率进行比较。 我们的基础模型在六个典型的下游任务上进行了验证,取得了最先进的结果。 值得注意的是,该基础模型可以提取稳定的特征表示,并在数据稀缺的情况下表现出强大的泛化能力。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.