电气工程与系统科学 > 图像与视频处理
[提交于 2025年7月30日
]
标题: 从单目RGB图像中准确估计后背深度和脊柱形态的双特征提取器框架
标题: A Dual-Feature Extractor Framework for Accurate Back Depth and Spine Morphology Estimation from Monocular RGB Images
摘要: 脊柱侧弯是一种常见的疾病,影响身体健康和外观,其中青少年特发性脊柱侧弯(AIS)是最常见的一种形式。 目前,主要的AIS评估工具是X光片,但存在显著的局限性,包括辐射暴露以及在贫困和偏远地区的可及性有限。 为了解决这个问题,当前的解决方案是使用RGB图像来分析脊柱形态。 然而,RGB图像极易受到环境因素的影响,例如光照条件,这会损害模型的稳定性和泛化能力。 因此,在本研究中,我们提出了一种新的流程,以准确估计裸露背部的深度信息,弥补二维信息的不足,然后通过整合深度和表面信息来估计脊柱形态。 为了精确捕捉背部表面的细微深度变化,我们设计了一个自适应多尺度特征学习网络,名为网格感知多尺度自适应网络(GAMA-Net)。 该模型使用双编码器提取块级和全局特征,这些特征通过基于块的混合注意(PBHA)模块进行交互。 自适应多尺度特征融合(AMFF)模块用于在解码器中动态融合信息。 结果表明,我们的深度估计模型在三个不同的评估指标上取得了显著的准确性,分别为近78.2%、93.6%和97.5%。 为了进一步验证预测深度的有效性,我们将表面和深度信息结合起来进行脊柱形态估计。 这种综合方法提高了脊柱曲线生成的准确性,达到了高达97%的出色性能。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.