计算机科学 > 计算机视觉与模式识别
[提交于 2025年1月10日
]
标题: Swin-X2S:使用Swin变换器从二维双平面X射线重建三维形状
标题: Swin-X2S: Reconstructing 3D Shape from 2D Biplanar X-ray with Swin Transformers
摘要: 从二维X射线到三维形状的转换在提高诊断效率和安全性方面具有重要潜力。 然而,现有的重建方法通常依赖于手工设计的特征、人工干预和先验知识,导致形状误差不稳定并增加额外的处理成本。 在本文中,我们引入了Swin-X2S,这是一种端到端的深度学习方法,可直接从二维双平面正交X射线图像中重建三维分割和标记。 Swin-X2S采用编码器-解码器架构:编码器利用二维Swin Transformer进行X射线信息提取,而解码器则采用带有交叉注意力的三维卷积来整合来自正交视图的结构特征。 引入了一个维度扩展模块,以连接编码器和解码器,确保从二维像素到三维体素的平滑转换。 我们通过在涵盖四个解剖结构(股骨、髋关节、脊柱和肋骨)的九个公开数据集上进行广泛定性和定量实验来评估所提出的方法,总共有54个类别。 不仅在分割和标记指标方面,而且在实际应用中首要关注的临床相关参数方面,都观察到了对之前方法的显著改进,这证明了Swin-X2S在临床场景中提供有效解剖形状重建选项的前景。 代码实现可在以下位置获得:\url{https://github.com/liukuan5625/Swin-X2S}
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.