电气工程与系统科学 > 图像与视频处理
[提交于 2025年6月17日
]
标题: Xray2Xray:基于体积上下文的胸部X光世界模型
标题: Xray2Xray: World Model from Chest X-rays with Volumetric Context
摘要: 胸部X光片(CXRs)是最常用的医学影像方式,在疾病诊断中起着关键作用。 然而,作为二维投影图像,CXRs受到结构重叠的限制,这限制了它们在精确疾病诊断和风险预测中的效果。 为了解决二维CXRs的局限性,本研究引入了Xray2Xray,这是一种新颖的世界模型,能够从胸部X光片中学习编码三维结构信息的潜在表示。 Xray2Xray通过使用视觉模型和转换模型对不同角度位置的X光投影的转换动态进行建模,从而捕捉胸部体积的潜在表示。 我们使用Xray2Xray的潜在表示进行下游的风险预测和疾病诊断任务。 实验结果表明,Xray2Xray在心血管疾病风险评估方面优于监督方法和自监督预训练方法,并在分类五种病理的CXRs中取得了具有竞争力的性能。 我们还通过合成任务评估了Xray2Xray潜在表示的质量,并证明潜在表示可用于重建体积上下文。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.