计算机科学 > 计算机视觉与模式识别
[提交于 2025年8月30日
]
标题: LUT-Fuse:通过蒸馏学习可学习查找表实现极快的红外与可见光图像融合
标题: LUT-Fuse: Towards Extremely Fast Infrared and Visible Image Fusion via Distillation to Learnable Look-Up Tables
摘要: 当前红外和可见光图像融合的高级研究主要集中在提高融合性能,常常忽视了在实时融合设备上的适用性。 在本文中,我们提出了一种新方法,通过蒸馏学习专门设计用于图像融合的可学习查找表,称为LUT-Fuse。 首先,我们开发了一种利用低阶近似编码和高层联合上下文场景编码的查找表结构,这非常适合多模态融合。 此外,鉴于多模态图像融合中缺乏真实标签,我们自然提出了高效的LUT蒸馏策略,而不是传统的量化LUT方法。 通过将多模态融合网络(MM-Net)的性能整合到MM-LUT模型中,我们的方法在效率和性能方面取得了显著突破。 它通常比当前轻量级SOTA融合算法所需时间少于十分之一,确保在各种场景下具有高速操作能力,即使在低功耗移动设备上也是如此。 大量实验验证了我们融合方法的优势、可靠性和稳定性。 代码可在https://github.com/zyb5/LUT-Fuse获取。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.