电气工程与系统科学 > 系统与控制
[提交于 2025年7月1日
]
标题: 基于未知扰动的卫星姿态控制模仿学习
标题: Imitation Learning for Satellite Attitude Control under Unknown Perturbations
摘要: 本文提出了一种新颖的卫星姿态控制框架,该框架将软演员-评论家(SAC)强化学习与生成对抗模仿学习(GAIL)相结合,以在各种未知扰动下实现鲁棒性能。传统控制技术通常依赖于精确的系统模型,并且对参数不确定性和外部扰动敏感。为了克服这些限制,我们首先开发了一个基于SAC的专家控制器,该控制器在应对执行器故障、传感器噪声和姿态不对齐方面表现出更强的弹性,在几个具有挑战性的场景中优于我们之前的结果。然后,我们使用GAIL训练一个模仿专家轨迹的学习策略,从而通过专家演示减少训练成本并提高泛化能力。在单个和组合扰动下的初步实验表明,SAC专家可以将天线旋转到指定方向,并在大多数列出的扰动中可靠地保持天线方向稳定。此外,GAIL学习者可以模仿SAC专家生成轨迹中的大部分特征。比较评估和消融研究证实了SAC算法和奖励塑造的有效性。GAIL的集成进一步降低了样本复杂度,并展示了有前景的模仿能力,为更智能和自主的航天器控制系统铺平了道路。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.