计算机科学 > 计算工程、金融与科学
[提交于 2025年5月25日
]
标题: RoofNet:用于屋顶材料分类的全球多模态数据集
标题: RoofNet: A Global Multimodal Dataset for Roof Material Classification
摘要: 自然灾害的频率和严重程度正在增加,每年造成数千亿美元的损失,并对基础设施和人类生计构成日益严重的威胁。 关于屋顶材料的准确数据对于建模建筑物对地震、洪水、野火和飓风等自然危害的脆弱性至关重要,但此类数据仍然无法获得。 为了解决这一问题,我们推出了RoofNet,这是迄今为止最大且地理上最多样化的新型多模态数据集,包含来自184个地理上多样的地点的超过51,500个样本,这些样本结合了高分辨率地球观测(EO)图像与全球屋顶材料分类的精心策划的文本注释。 RoofNet包括地理上多样的卫星图像,这些图像被标记为14种关键屋顶类型——例如沥青瓦、粘土瓦片和金属板——并设计用于通过视觉语言建模(VLM)增强全球暴露数据集的保真度。 我们从气候和建筑上截然不同的地区采样EO图块,构建代表性数据集。 与领域专家合作,对其中6,000张图像进行了注释,以微调VLM。 我们使用地理和材料感知提示调优来提高类别可分离性。 然后应用微调后的模型到剩余的EO图块上,通过基于规则和人机协作验证进行预测优化。 除了材料标签外,RoofNet还提供丰富的元数据,包括屋顶形状、占地面积、太阳能板存在情况以及混合屋顶材料(如暖通空调系统)的指示器。 RoofNet支持可扩展的AI驱动的风险评估,并作为下游基准,用于评估模型在各地区的泛化能力——为保险承保、灾害准备和基础设施政策规划提供切实可行的见解。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.