Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > eess > arXiv:2506.23466

帮助 | 高级搜索

电气工程与系统科学 > 图像与视频处理

arXiv:2506.23466 (eess)
[提交于 2025年6月30日 ]

标题: FD-DiT:频域引导的扩散变压器用于低剂量CT重建

标题: FD-DiT: Frequency Domain-Directed Diffusion Transformer for Low-Dose CT Reconstruction

Authors:Qiqing Liu, Guoquan Wei, Zekun Zhou, Yiyang Wen, Liu Shi, Qiegen Liu
摘要: 低剂量计算机断层扫描(LDCT)减少了辐射暴露,但由于量子和电子噪声导致图像伪影和细节丢失,可能影响诊断准确性。 将Transformer与扩散模型结合已被证明是图像生成的一种有前途的方法。 然而,现有方法在保留细粒度图像细节方面存在局限性。 为了解决这个问题,提出了频域引导的扩散Transformer(FD-DiT)用于LDCT重建。 FD-DiT的核心是一种扩散策略,逐步引入噪声,直到分布统计上与LDCT数据一致,然后进行去噪处理。 此外,我们采用频域解耦技术,将噪声主要集中在高频域,从而有助于有效捕捉关键解剖结构和细小细节。 然后使用混合去噪网络优化整体数据重建过程。 为了增强识别高频噪声的能力,我们引入滑动稀疏局部注意力,利用浅层信息的稀疏性和局部性,并通过跳跃连接传播它们以改善特征表示。 最后,我们提出了一种可学习的动态融合策略以实现最佳组件集成。 实验结果表明,在相同剂量水平下,由FD-DiT重建的LDCT图像在噪声和伪影抑制方面优于最先进方法。
摘要: Low-dose computed tomography (LDCT) reduces radiation exposure but suffers from image artifacts and loss of detail due to quantum and electronic noise, potentially impacting diagnostic accuracy. Transformer combined with diffusion models has been a promising approach for image generation. Nevertheless, existing methods exhibit limitations in preserving finegrained image details. To address this issue, frequency domain-directed diffusion transformer (FD-DiT) is proposed for LDCT reconstruction. FD-DiT centers on a diffusion strategy that progressively introduces noise until the distribution statistically aligns with that of LDCT data, followed by denoising processing. Furthermore, we employ a frequency decoupling technique to concentrate noise primarily in high-frequency domain, thereby facilitating effective capture of essential anatomical structures and fine details. A hybrid denoising network is then utilized to optimize the overall data reconstruction process. To enhance the capability in recognizing high-frequency noise, we incorporate sliding sparse local attention to leverage the sparsity and locality of shallow-layer information, propagating them via skip connections for improving feature representation. Finally, we propose a learnable dynamic fusion strategy for optimal component integration. Experimental results demonstrate that at identical dose levels, LDCT images reconstructed by FD-DiT exhibit superior noise and artifact suppression compared to state-of-the-art methods.
评论: 11页,11图
主题: 图像与视频处理 (eess.IV) ; 计算机视觉与模式识别 (cs.CV); 医学物理 (physics.med-ph)
引用方式: arXiv:2506.23466 [eess.IV]
  (或者 arXiv:2506.23466v1 [eess.IV] 对于此版本)
  https://doi.org/10.48550/arXiv.2506.23466
通过 DataCite 发表的 arXiv DOI(待注册)

提交历史

来自: Qiegen Liu [查看电子邮件]
[v1] 星期一, 2025 年 6 月 30 日 02:16:38 UTC (2,055 KB)
全文链接:

获取论文:

    查看标题为《》的 PDF
  • 查看中文 PDF
  • 查看 PDF
  • 其他格式
查看许可
当前浏览上下文:
eess.IV
< 上一篇   |   下一篇 >
新的 | 最近的 | 2025-06
切换浏览方式为:
cs
cs.CV
eess
physics
physics.med-ph

参考文献与引用

  • NASA ADS
  • 谷歌学术搜索
  • 语义学者
a 导出 BibTeX 引用 加载中...

BibTeX 格式的引用

×
数据由提供:

收藏

BibSonomy logo Reddit logo

文献和引用工具

文献资源探索 (什么是资源探索?)
连接的论文 (什么是连接的论文?)
Litmaps (什么是 Litmaps?)
scite 智能引用 (什么是智能引用?)

与本文相关的代码,数据和媒体

alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)

演示

复制 (什么是复制?)
Hugging Face Spaces (什么是 Spaces?)
TXYZ.AI (什么是 TXYZ.AI?)

推荐器和搜索工具

影响之花 (什么是影响之花?)
核心推荐器 (什么是核心?)
IArxiv 推荐器 (什么是 IArxiv?)
  • 作者
  • 地点
  • 机构
  • 主题

arXivLabs:与社区合作伙伴的实验项目

arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。

与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。

有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.

这篇论文的哪些作者是支持者? | 禁用 MathJax (什么是 MathJax?)
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号