Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > cs > arXiv:2504.07393

帮助 | 高级搜索

计算机科学 > 机器学习

arXiv:2504.07393 (cs)
[提交于 2025年4月10日 ]

标题: 自适应机器学习方法中使用粒子滤波进行状态估计:将 Q 学习和 NEAT 算法与噪声雷达测量相结合

标题: State Estimation Using Particle Filtering in Adaptive Machine Learning Methods: Integrating Q-Learning and NEAT Algorithms with Noisy Radar Measurements

Authors:Wonjin Song, Feng Bao
摘要: 可靠的状态估计对于在复杂、嘈杂环境中运行的自主系统至关重要。经典滤波方法,例如卡尔曼滤波器,在面对非线性动态或非高斯噪声时可能会遇到困难,而即使更加灵活的粒子滤波器在大规模领域中也常常会遭遇样本退化或计算成本高的问题。同时,自适应机器学习技术,包括Q学习和神经进化算法(如NEAT),严重依赖于准确的状态反馈来引导学习;当传感器数据不完美时,这些方法会出现收敛性能下降和次优表现的问题。本文提出了一种集成框架,将粒子滤波与Q学习和NEAT相结合,以明确解决噪声测量的挑战。通过改进基于雷达的观测值,我们的粒子滤波器驱动了更稳定的策略更新(在Q学习中)或控制器演化(在NEAT中),使强化学习和神经进化都能更快地收敛,获得更高的回报或适应度,并表现出更强的传感器不确定性鲁棒性。基于网格导航和模拟汽车环境的实验表明,在训练稳定性、最终性能和成功率方面相对于缺乏高级滤波技术的基线模型具有持续的优势。总体而言,这些发现强调了准确的状态估计不仅仅是预处理步骤,而是能够在受传感器噪声困扰的实际应用中显著提升自适应机器学习能力的关键组成部分。
摘要: Reliable state estimation is essential for autonomous systems operating in complex, noisy environments. Classical filtering approaches, such as the Kalman filter, can struggle when facing nonlinear dynamics or non-Gaussian noise, and even more flexible particle filters often encounter sample degeneracy or high computational costs in large-scale domains. Meanwhile, adaptive machine learning techniques, including Q-learning and neuroevolutionary algorithms such as NEAT, rely heavily on accurate state feedback to guide learning; when sensor data are imperfect, these methods suffer from degraded convergence and suboptimal performance. In this paper, we propose an integrated framework that unifies particle filtering with Q-learning and NEAT to explicitly address the challenge of noisy measurements. By refining radar-based observations into reliable state estimates, our particle filter drives more stable policy updates (in Q-learning) or controller evolution (in NEAT), allowing both reinforcement learning and neuroevolution to converge faster, achieve higher returns or fitness, and exhibit greater resilience to sensor uncertainty. Experiments on grid-based navigation and a simulated car environment highlight consistent gains in training stability, final performance, and success rates over baselines lacking advanced filtering. Altogether, these findings underscore that accurate state estimation is not merely a preprocessing step, but a vital component capable of substantially enhancing adaptive machine learning in real-world applications plagued by sensor noise.
主题: 机器学习 (cs.LG) ; 优化与控制 (math.OC)
引用方式: arXiv:2504.07393 [cs.LG]
  (或者 arXiv:2504.07393v1 [cs.LG] 对于此版本)
  https://doi.org/10.48550/arXiv.2504.07393
通过 DataCite 发表的 arXiv DOI

提交历史

来自: Wonjin Song [查看电子邮件]
[v1] 星期四, 2025 年 4 月 10 日 02:20:45 UTC (647 KB)
全文链接:

获取论文:

    查看标题为《》的 PDF
  • 查看中文 PDF
  • 查看 PDF
  • HTML(实验性)
  • TeX 源代码
  • 其他格式
查看许可
当前浏览上下文:
math.OC
< 上一篇   |   下一篇 >
新的 | 最近的 | 2025-04
切换浏览方式为:
cs
cs.LG
math

参考文献与引用

  • NASA ADS
  • 谷歌学术搜索
  • 语义学者
a 导出 BibTeX 引用 加载中...

BibTeX 格式的引用

×
数据由提供:

收藏

BibSonomy logo Reddit logo

文献和引用工具

文献资源探索 (什么是资源探索?)
连接的论文 (什么是连接的论文?)
Litmaps (什么是 Litmaps?)
scite 智能引用 (什么是智能引用?)

与本文相关的代码,数据和媒体

alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)

演示

复制 (什么是复制?)
Hugging Face Spaces (什么是 Spaces?)
TXYZ.AI (什么是 TXYZ.AI?)

推荐器和搜索工具

影响之花 (什么是影响之花?)
核心推荐器 (什么是核心?)
IArxiv 推荐器 (什么是 IArxiv?)
  • 作者
  • 地点
  • 机构
  • 主题

arXivLabs:与社区合作伙伴的实验项目

arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。

与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。

有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.

这篇论文的哪些作者是支持者? | 禁用 MathJax (什么是 MathJax?)
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号