计算机科学 > 机器学习
[提交于 2025年4月10日
]
标题: 自适应机器学习方法中使用粒子滤波进行状态估计:将 Q 学习和 NEAT 算法与噪声雷达测量相结合
标题: State Estimation Using Particle Filtering in Adaptive Machine Learning Methods: Integrating Q-Learning and NEAT Algorithms with Noisy Radar Measurements
摘要: 可靠的状态估计对于在复杂、嘈杂环境中运行的自主系统至关重要。经典滤波方法,例如卡尔曼滤波器,在面对非线性动态或非高斯噪声时可能会遇到困难,而即使更加灵活的粒子滤波器在大规模领域中也常常会遭遇样本退化或计算成本高的问题。同时,自适应机器学习技术,包括Q学习和神经进化算法(如NEAT),严重依赖于准确的状态反馈来引导学习;当传感器数据不完美时,这些方法会出现收敛性能下降和次优表现的问题。本文提出了一种集成框架,将粒子滤波与Q学习和NEAT相结合,以明确解决噪声测量的挑战。通过改进基于雷达的观测值,我们的粒子滤波器驱动了更稳定的策略更新(在Q学习中)或控制器演化(在NEAT中),使强化学习和神经进化都能更快地收敛,获得更高的回报或适应度,并表现出更强的传感器不确定性鲁棒性。基于网格导航和模拟汽车环境的实验表明,在训练稳定性、最终性能和成功率方面相对于缺乏高级滤波技术的基线模型具有持续的优势。总体而言,这些发现强调了准确的状态估计不仅仅是预处理步骤,而是能够在受传感器噪声困扰的实际应用中显著提升自适应机器学习能力的关键组成部分。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.