计算机科学 > 计算机视觉与模式识别
[提交于 2025年7月3日
]
标题: USAD:一种无监督数据增强时空注意力扩散网络
标题: USAD: An Unsupervised Data Augmentation Spatio-Temporal Attention Diffusion Network
摘要: 人类活动识别(HAR)的主要目标是从传感器数据中推断正在进行的人类动作,这项任务在健康监测、安全保护和运动分析中有着广泛的应用。 尽管研究层出不穷,HAR仍然面临一些关键挑战,包括稀有活动的标记样本不足、高层次特征提取不足以及在轻量级设备上的模型性能不佳。 为了解决这些问题,本文提出了一种以多注意力交互机制为核心的综合优化方法。 首先,采用一种无监督的、统计引导的扩散模型进行数据增强,从而缓解标记数据稀缺和严重类别不平衡的问题。 其次,设计了一个多分支时空交互网络,通过并行的带有3*3、5*5和7*7卷积核的残差分支捕捉序列数据的多尺度特征。 同时,引入时间注意力机制以识别关键时间点,而空间注意力则增强了传感器间的交互。 进一步引入了跨分支特征融合单元,以提高整体特征表示能力。 最后,集成了自适应多损失函数融合策略,允许动态调整损失权重和整体模型优化。 在三个公开数据集WISDM、PAMAP2和OPPORTUNITY上的实验结果表明,所提出的无监督数据增强时空注意力扩散网络(USAD)分别达到了98.84%、93.81%和80.92%的准确率,显著优于现有方法。 此外,在嵌入式设备上的实际部署验证了所提方法的效率和可行性。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.