计算机科学 > 计算机视觉与模式识别
[提交于 2025年5月30日
]
标题: FastCAR:多任务学习中用于检测对象类别连续属性变量建模的任务巩固的快速分类与回归
标题: FastCAR: Fast Classification And Regression for Task Consolidation in Multi-Task Learning to Model a Continuous Property Variable of Detected Object Class
摘要: FastCAR 是一种新颖的任务聚合方法,适用于多任务学习(MTL),用于分类和回归任务,尽管任务异质性并非微不足道且仅有细微的相关性。 该方法解决了检测到的对象分类(占据整个图像帧)以及连续属性变量的回归建模(针对某一对象类别的实例),这是科学和工程中的一个关键应用场景。 FastCAR 包含一种标签转换方法,可与单一任务回归网络架构配合使用。 当同时考虑学习这两个任务时,FastCAR 在传统 MTL 模型族(基于架构和损失加权方案的参数化)的表现上更为出色(分类准确率为 99.54%,回归平均绝对百分比误差为 2.4%)。 所进行的实验采用了我们贡献的“高级钢材属性数据集”https://github.com/fastcandr/AdvancedSteel-Property-Dataset。 该数据集包含 4536 张 224x224 像素的图像,标注了离散的对象类别及其硬度属性,后者可以取连续值。 我们提出的 FastCAR 方法在任务聚合方面实现了训练时间效率(快 2.52 倍)和降低推理延迟(快 55%)优于基准 MTL 网络。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.