Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > cs > arXiv:2506.22570

帮助 | 高级搜索

计算机科学 > 计算机视觉与模式识别

arXiv:2506.22570 (cs)
[提交于 2025年6月27日 ]

标题: 双空洞可分离卷积用于提高农业语义分割

标题: Dual Atrous Separable Convolution for Improving Agricultural Semantic Segmentation

Authors:Chee Mei Ling, Thangarajah Akilan, Aparna Ravinda Phalke
摘要: 农业图像语义分割是现代农业的一个关键组成部分,有助于准确的视觉数据分析,以改善作物管理、优化资源利用并提高整体生产力。 本研究提出了一种用于精准农业的高效图像分割方法,重点是准确划分农田异常,以支持决策和主动干预。 在基于DeepLabV3的分割框架中集成了一个新颖的双空洞可分离卷积(DAS Conv)模块。 DAS Conv模块经过精心设计,以在膨胀率和填充大小之间达到最佳平衡,从而在不牺牲效率的情况下提高模型性能。 该研究还结合了从编码器中最佳阶段到解码器的战略跳跃连接,以增强模型捕捉细粒度空间特征的能力。 尽管计算复杂度较低,所提出的模型优于基线模型,并在Agriculture Vision基准数据集上实现了与高度复杂的基于变压器的最先进(SOTA)模型相当的性能。 在考虑模型复杂性和性能之间的权衡时,与SOTA模型相比,该模型在效率方面提高了超过66%。 本研究突出了一个高效且有效的解决方案,用于改进遥感应用中的语义分割,提供了一个计算轻量级的模型,能够在农业图像中实现高质量的性能。
摘要: Agricultural image semantic segmentation is a pivotal component of modern agriculture, facilitating accurate visual data analysis to improve crop management, optimize resource utilization, and boost overall productivity. This study proposes an efficient image segmentation method for precision agriculture, focusing on accurately delineating farmland anomalies to support informed decision-making and proactive interventions. A novel Dual Atrous Separable Convolution (DAS Conv) module is integrated within the DeepLabV3-based segmentation framework. The DAS Conv module is meticulously designed to achieve an optimal balance between dilation rates and padding size, thereby enhancing model performance without compromising efficiency. The study also incorporates a strategic skip connection from an optimal stage in the encoder to the decoder to bolster the model's capacity to capture fine-grained spatial features. Despite its lower computational complexity, the proposed model outperforms its baseline and achieves performance comparable to highly complex transformer-based state-of-the-art (SOTA) models on the Agriculture Vision benchmark dataset. It achieves more than 66% improvement in efficiency when considering the trade-off between model complexity and performance, compared to the SOTA model. This study highlights an efficient and effective solution for improving semantic segmentation in remote sensing applications, offering a computationally lightweight model capable of high-quality performance in agricultural imagery.
评论: 17页,7图,6表
主题: 计算机视觉与模式识别 (cs.CV)
引用方式: arXiv:2506.22570 [cs.CV]
  (或者 arXiv:2506.22570v1 [cs.CV] 对于此版本)
  https://doi.org/10.48550/arXiv.2506.22570
通过 DataCite 发表的 arXiv DOI

提交历史

来自: Mei Ling Chee Ms [查看电子邮件]
[v1] 星期五, 2025 年 6 月 27 日 18:37:43 UTC (10,683 KB)
全文链接:

获取论文:

    查看标题为《》的 PDF
  • 查看中文 PDF
  • 查看 PDF
  • HTML(实验性)
  • TeX 源代码
  • 其他格式
许可图标 查看许可
当前浏览上下文:
cs.CV
< 上一篇   |   下一篇 >
新的 | 最近的 | 2025-06
切换浏览方式为:
cs

参考文献与引用

  • NASA ADS
  • 谷歌学术搜索
  • 语义学者
a 导出 BibTeX 引用 加载中...

BibTeX 格式的引用

×
数据由提供:

收藏

BibSonomy logo Reddit logo

文献和引用工具

文献资源探索 (什么是资源探索?)
连接的论文 (什么是连接的论文?)
Litmaps (什么是 Litmaps?)
scite 智能引用 (什么是智能引用?)

与本文相关的代码,数据和媒体

alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)

演示

复制 (什么是复制?)
Hugging Face Spaces (什么是 Spaces?)
TXYZ.AI (什么是 TXYZ.AI?)

推荐器和搜索工具

影响之花 (什么是影响之花?)
核心推荐器 (什么是核心?)
IArxiv 推荐器 (什么是 IArxiv?)
  • 作者
  • 地点
  • 机构
  • 主题

arXivLabs:与社区合作伙伴的实验项目

arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。

与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。

有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.

这篇论文的哪些作者是支持者? | 禁用 MathJax (什么是 MathJax?)
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号