Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > cs > arXiv:2507.02171v1

帮助 | 高级搜索

计算机科学 > 机器人技术

arXiv:2507.02171v1 (cs)
[提交于 2025年7月2日 ]

标题: 通过自监督RNN实现生物启发式机器人轨迹规划

标题: Towards Bio-Inspired Robotic Trajectory Planning via Self-Supervised RNN

Authors:Miroslav Cibula, Kristína Malinovská, Matthias Kerzel
摘要: 机器人轨迹规划被理解为生成一系列关节配置,使机器人代理或其机械臂从初始状态到达期望的最终状态,从而在考虑机器人运动学和环境约束的情况下完成操作任务。 通常,这是通过基于采样的规划器实现的,这计算量较大。 最近的进展表明,轨迹规划也可以通过轨迹的监督序列学习来完成,通常只需要通过神经架构一次或固定次数,从而确保计算时间有限。 然而,这种完全监督的方法进行的是模仿学习;它们不是根据轨迹是否能成功到达目标来学习,而是试图复制观察到的轨迹。 在我们的工作中,我们在此方法的基础上,提出了一种基于循环架构的认知启发式自监督学习方案,用于构建轨迹模型。 我们在一个机械臂的运动学规划任务上评估了所提出方法的可行性。 结果表明,该模型能够仅使用给定的正向和逆向运动学模型对来学习生成轨迹,并表明这种新方法可能有助于需要自适应解决方案的更复杂的操作任务的规划。
摘要: Trajectory planning in robotics is understood as generating a sequence of joint configurations that will lead a robotic agent, or its manipulator, from an initial state to the desired final state, thus completing a manipulation task while considering constraints like robot kinematics and the environment. Typically, this is achieved via sampling-based planners, which are computationally intensive. Recent advances demonstrate that trajectory planning can also be performed by supervised sequence learning of trajectories, often requiring only a single or fixed number of passes through a neural architecture, thus ensuring a bounded computation time. Such fully supervised approaches, however, perform imitation learning; they do not learn based on whether the trajectories can successfully reach a goal, but try to reproduce observed trajectories. In our work, we build on this approach and propose a cognitively inspired self-supervised learning scheme based on a recurrent architecture for building a trajectory model. We evaluate the feasibility of the proposed method on a task of kinematic planning for a robotic arm. The results suggest that the model is able to learn to generate trajectories only using given paired forward and inverse kinematics models, and indicate that this novel method could facilitate planning for more complex manipulation tasks requiring adaptive solutions.
评论: 12页,4张图表,2张表格。将发表于2025年国际人工神经网络会议(ICANN)论文集。这项研究由欧洲地平线项目TERAIS资助,项目编号为101079338,并部分由斯洛伐克科学基金(VEGA)项目1/0373/23资助。
主题: 机器人技术 (cs.RO) ; 人工智能 (cs.AI); 机器学习 (cs.LG)
引用方式: arXiv:2507.02171 [cs.RO]
  (或者 arXiv:2507.02171v1 [cs.RO] 对于此版本)
  https://doi.org/10.48550/arXiv.2507.02171
通过 DataCite 发表的 arXiv DOI

提交历史

来自: Miroslav Cibula [查看电子邮件]
[v1] 星期三, 2025 年 7 月 2 日 22:05:58 UTC (894 KB)
全文链接:

获取论文:

    查看标题为《》的 PDF
  • 查看中文 PDF
  • 查看 PDF
  • HTML(实验性)
  • TeX 源代码
  • 其他格式
许可图标 查看许可
当前浏览上下文:
cs.RO
< 上一篇   |   下一篇 >
新的 | 最近的 | 2025-07
切换浏览方式为:
cs
cs.AI
cs.LG

参考文献与引用

  • NASA ADS
  • 谷歌学术搜索
  • 语义学者
a 导出 BibTeX 引用 加载中...

BibTeX 格式的引用

×
数据由提供:

收藏

BibSonomy logo Reddit logo

文献和引用工具

文献资源探索 (什么是资源探索?)
连接的论文 (什么是连接的论文?)
Litmaps (什么是 Litmaps?)
scite 智能引用 (什么是智能引用?)

与本文相关的代码,数据和媒体

alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)

演示

复制 (什么是复制?)
Hugging Face Spaces (什么是 Spaces?)
TXYZ.AI (什么是 TXYZ.AI?)

推荐器和搜索工具

影响之花 (什么是影响之花?)
核心推荐器 (什么是核心?)
IArxiv 推荐器 (什么是 IArxiv?)
  • 作者
  • 地点
  • 机构
  • 主题

arXivLabs:与社区合作伙伴的实验项目

arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。

与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。

有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.

这篇论文的哪些作者是支持者? | 禁用 MathJax (什么是 MathJax?)
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号