Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > eess > arXiv:2507.16803

帮助 | 高级搜索

电气工程与系统科学 > 图像与视频处理

arXiv:2507.16803 (eess)
[提交于 2025年7月22日 ]

标题: 多任务DeltaNet:基于变化检测的原位ETEM图像分割及其在碳气化动力学中的应用

标题: MultiTaskDeltaNet: Change Detection-based Image Segmentation for Operando ETEM with Application to Carbon Gasification Kinetics

Authors:Yushuo Niu, Tianyu Li, Yuanyuan Zhu, Qian Yang
摘要: 将原位透射电子显微镜(TEM)成像转化为用于固态反应的空间分辨操作表征工具,需要对动态演化的特征进行自动化、高精度的语义分割。 然而,传统的语义分割深度学习方法由于标注数据稀缺、感兴趣视觉模糊的特征以及小物体场景而经常遇到限制。 为解决这些挑战,我们引入了MultiTaskDeltaNet(MTDN),一种创新的深度学习架构,创造性地将分割任务重新概念化为变化检测问题。 通过实现一个带有U-Net主干的唯一孪生网络,并使用配对图像来捕捉特征变化,MTDN有效地利用最少的数据生成高质量的分割结果。 此外,MTDN利用多任务学习策略来利用感兴趣的物理特征之间的相关性。 在使用丝状碳气化原位环境TEM(ETEM)视频数据进行评估时,MTDN在准确描绘精细结构特征方面明显优于传统分割模型。 值得注意的是,MTDN在预测小而视觉模糊的物理特征方面比传统分割模型提高了10.22%的性能。 这项工作弥合了深度学习与实际TEM图像分析之间的几个关键差距,推动了复杂实验环境中纳米材料的自动化表征。
摘要: Transforming in-situ transmission electron microscopy (TEM) imaging into a tool for spatially-resolved operando characterization of solid-state reactions requires automated, high-precision semantic segmentation of dynamically evolving features. However, traditional deep learning methods for semantic segmentation often encounter limitations due to the scarcity of labeled data, visually ambiguous features of interest, and small-object scenarios. To tackle these challenges, we introduce MultiTaskDeltaNet (MTDN), a novel deep learning architecture that creatively reconceptualizes the segmentation task as a change detection problem. By implementing a unique Siamese network with a U-Net backbone and using paired images to capture feature changes, MTDN effectively utilizes minimal data to produce high-quality segmentations. Furthermore, MTDN utilizes a multi-task learning strategy to leverage correlations between physical features of interest. In an evaluation using data from in-situ environmental TEM (ETEM) videos of filamentous carbon gasification, MTDN demonstrated a significant advantage over conventional segmentation models, particularly in accurately delineating fine structural features. Notably, MTDN achieved a 10.22% performance improvement over conventional segmentation models in predicting small and visually ambiguous physical features. This work bridges several key gaps between deep learning and practical TEM image analysis, advancing automated characterization of nanomaterials in complex experimental settings.
主题: 图像与视频处理 (eess.IV) ; 计算机视觉与模式识别 (cs.CV)
引用方式: arXiv:2507.16803 [eess.IV]
  (或者 arXiv:2507.16803v1 [eess.IV] 对于此版本)
  https://doi.org/10.48550/arXiv.2507.16803
通过 DataCite 发表的 arXiv DOI(待注册)

提交历史

来自: Qian Yang [查看电子邮件]
[v1] 星期二, 2025 年 7 月 22 日 17:52:35 UTC (19,926 KB)
全文链接:

获取论文:

    查看标题为《》的 PDF
  • 查看中文 PDF
  • 查看 PDF
  • HTML(实验性)
  • TeX 源代码
  • 其他格式
查看许可
当前浏览上下文:
eess.IV
< 上一篇   |   下一篇 >
新的 | 最近的 | 2025-07
切换浏览方式为:
cs
cs.CV
eess

参考文献与引用

  • NASA ADS
  • 谷歌学术搜索
  • 语义学者
a 导出 BibTeX 引用 加载中...

BibTeX 格式的引用

×
数据由提供:

收藏

BibSonomy logo Reddit logo

文献和引用工具

文献资源探索 (什么是资源探索?)
连接的论文 (什么是连接的论文?)
Litmaps (什么是 Litmaps?)
scite 智能引用 (什么是智能引用?)

与本文相关的代码,数据和媒体

alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)

演示

复制 (什么是复制?)
Hugging Face Spaces (什么是 Spaces?)
TXYZ.AI (什么是 TXYZ.AI?)

推荐器和搜索工具

影响之花 (什么是影响之花?)
核心推荐器 (什么是核心?)
IArxiv 推荐器 (什么是 IArxiv?)
  • 作者
  • 地点
  • 机构
  • 主题

arXivLabs:与社区合作伙伴的实验项目

arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。

与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。

有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.

这篇论文的哪些作者是支持者? | 禁用 MathJax (什么是 MathJax?)
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号