Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > eess > arXiv:2507.01161

帮助 | 高级搜索

电气工程与系统科学 > 系统与控制

arXiv:2507.01161 (eess)
[提交于 2025年7月1日 ]

标题: 基于未知扰动的卫星姿态控制模仿学习

标题: Imitation Learning for Satellite Attitude Control under Unknown Perturbations

Authors:Zhizhuo Zhang, Hao Peng, Xiaoli Bai
摘要: 本文提出了一种新颖的卫星姿态控制框架,该框架将软演员-评论家(SAC)强化学习与生成对抗模仿学习(GAIL)相结合,以在各种未知扰动下实现鲁棒性能。传统控制技术通常依赖于精确的系统模型,并且对参数不确定性和外部扰动敏感。为了克服这些限制,我们首先开发了一个基于SAC的专家控制器,该控制器在应对执行器故障、传感器噪声和姿态不对齐方面表现出更强的弹性,在几个具有挑战性的场景中优于我们之前的结果。然后,我们使用GAIL训练一个模仿专家轨迹的学习策略,从而通过专家演示减少训练成本并提高泛化能力。在单个和组合扰动下的初步实验表明,SAC专家可以将天线旋转到指定方向,并在大多数列出的扰动中可靠地保持天线方向稳定。此外,GAIL学习者可以模仿SAC专家生成轨迹中的大部分特征。比较评估和消融研究证实了SAC算法和奖励塑造的有效性。GAIL的集成进一步降低了样本复杂度,并展示了有前景的模仿能力,为更智能和自主的航天器控制系统铺平了道路。
摘要: This paper presents a novel satellite attitude control framework that integrates Soft Actor-Critic (SAC) reinforcement learning with Generative Adversarial Imitation Learning (GAIL) to achieve robust performance under various unknown perturbations. Traditional control techniques often rely on precise system models and are sensitive to parameter uncertainties and external perturbations. To overcome these limitations, we first develop a SAC-based expert controller that demonstrates improved resilience against actuator failures, sensor noise, and attitude misalignments, outperforming our previous results in several challenging scenarios. We then use GAIL to train a learner policy that imitates the expert's trajectories, thereby reducing training costs and improving generalization through expert demonstrations. Preliminary experiments under single and combined perturbations show that the SAC expert can rotate the antenna to a specified direction and keep the antenna orientation reliably stable in most of the listed perturbations. Additionally, the GAIL learner can imitate most of the features from the trajectories generated by the SAC expert. Comparative evaluations and ablation studies confirm the effectiveness of the SAC algorithm and reward shaping. The integration of GAIL further reduces sample complexity and demonstrates promising imitation capabilities, paving the way for more intelligent and autonomous spacecraft control systems.
评论: 2025年AAS/AIAA轨道动力学专题会议
主题: 系统与控制 (eess.SY) ; 机器人技术 (cs.RO)
引用方式: arXiv:2507.01161 [eess.SY]
  (或者 arXiv:2507.01161v1 [eess.SY] 对于此版本)
  https://doi.org/10.48550/arXiv.2507.01161
通过 DataCite 发表的 arXiv DOI

提交历史

来自: Zhizhuo Zhang [查看电子邮件]
[v1] 星期二, 2025 年 7 月 1 日 19:50:06 UTC (17,127 KB)
全文链接:

获取论文:

    查看标题为《》的 PDF
  • 查看中文 PDF
  • 查看 PDF
  • HTML(实验性)
  • TeX 源代码
  • 其他格式
查看许可
当前浏览上下文:
eess
< 上一篇   |   下一篇 >
新的 | 最近的 | 2025-07
切换浏览方式为:
cs
cs.RO
cs.SY
eess.SY

参考文献与引用

  • NASA ADS
  • 谷歌学术搜索
  • 语义学者
a 导出 BibTeX 引用 加载中...

BibTeX 格式的引用

×
数据由提供:

收藏

BibSonomy logo Reddit logo

文献和引用工具

文献资源探索 (什么是资源探索?)
连接的论文 (什么是连接的论文?)
Litmaps (什么是 Litmaps?)
scite 智能引用 (什么是智能引用?)

与本文相关的代码,数据和媒体

alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)

演示

复制 (什么是复制?)
Hugging Face Spaces (什么是 Spaces?)
TXYZ.AI (什么是 TXYZ.AI?)

推荐器和搜索工具

影响之花 (什么是影响之花?)
核心推荐器 (什么是核心?)
IArxiv 推荐器 (什么是 IArxiv?)
  • 作者
  • 地点
  • 机构
  • 主题

arXivLabs:与社区合作伙伴的实验项目

arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。

与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。

有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.

这篇论文的哪些作者是支持者? | 禁用 MathJax (什么是 MathJax?)
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号