Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > cs > arXiv:2506.21628

帮助 | 高级搜索

计算机科学 > 机器人技术

arXiv:2506.21628 (cs)
[提交于 2025年6月24日 ]

标题: Ark:一个基于 Python 的开源机器人学习框架

标题: Ark: An Open-source Python-based Framework for Robot Learning

Authors:Magnus Dierking, Christopher E. Mower, Sarthak Das, Huang Helong, Jiacheng Qiu, Cody Reading, Wei Chen, Huidong Liang, Huang Guowei, Jan Peters, Quan Xingyue, Jun Wang, Haitham Bou-Ammar
摘要: 机器人技术在硬件方面取得了显著进展——从DARPA的城市和机器人挑战赛到首届人形机器人踢拳比赛——但商业自主性仍然落后于机器学习的进步。 主要瓶颈在于软件:当前的机器人系统需要陡峭的学习曲线、低级的C/C++专业知识、零散的工具以及复杂的硬件集成,这与推动现代人工智能发展的以Python为中心、文档完善的生态系统形成鲜明对比。 我们介绍了ARK,这是一个开源的、以Python为主的机器人框架,旨在弥补这一差距。 ARK提供了一个类似Gym的环境接口,允许用户收集数据、预处理数据,并使用最先进的模仿学习算法(例如ACT、扩散策略)训练策略,同时在高保真仿真和物理机器人之间无缝切换。 轻量级的客户端-服务器架构提供了网络化的发布-订阅通信,可选的C/C++绑定确保在需要时实现实时性能。 ARK附带了用于控制、SLAM、运动规划、系统识别和可视化的可重用模块,以及原生的ROS互操作性。 全面的文档和案例研究——从操作到移动导航——展示了快速原型设计、轻松的硬件更换以及端到端流程,这些流程在便利性上可以与主流机器学习工作流程相媲美。 通过在共同的Python框架下统一机器人技术和人工智能实践,ARK降低了入门门槛,并加速了自主机器人的研究和商业部署。
摘要: Robotics has made remarkable hardware strides-from DARPA's Urban and Robotics Challenges to the first humanoid-robot kickboxing tournament-yet commercial autonomy still lags behind progress in machine learning. A major bottleneck is software: current robot stacks demand steep learning curves, low-level C/C++ expertise, fragmented tooling, and intricate hardware integration, in stark contrast to the Python-centric, well-documented ecosystems that propelled modern AI. We introduce ARK, an open-source, Python-first robotics framework designed to close that gap. ARK presents a Gym-style environment interface that allows users to collect data, preprocess it, and train policies using state-of-the-art imitation-learning algorithms (e.g., ACT, Diffusion Policy) while seamlessly toggling between high-fidelity simulation and physical robots. A lightweight client-server architecture provides networked publisher-subscriber communication, and optional C/C++ bindings ensure real-time performance when needed. ARK ships with reusable modules for control, SLAM, motion planning, system identification, and visualization, along with native ROS interoperability. Comprehensive documentation and case studies-from manipulation to mobile navigation-demonstrate rapid prototyping, effortless hardware swapping, and end-to-end pipelines that rival the convenience of mainstream machine-learning workflows. By unifying robotics and AI practices under a common Python umbrella, ARK lowers entry barriers and accelerates research and commercial deployment of autonomous robots.
主题: 机器人技术 (cs.RO) ; 人工智能 (cs.AI); 机器学习 (cs.LG)
引用方式: arXiv:2506.21628 [cs.RO]
  (或者 arXiv:2506.21628v1 [cs.RO] 对于此版本)
  https://doi.org/10.48550/arXiv.2506.21628
通过 DataCite 发表的 arXiv DOI

提交历史

来自: Magnus Dierking Mr [查看电子邮件]
[v1] 星期二, 2025 年 6 月 24 日 20:23:39 UTC (24,617 KB)
全文链接:

获取论文:

    查看标题为《》的 PDF
  • 查看中文 PDF
  • 查看 PDF
  • HTML(实验性)
  • TeX 源代码
  • 其他格式
查看许可
当前浏览上下文:
cs.RO
< 上一篇   |   下一篇 >
新的 | 最近的 | 2025-06
切换浏览方式为:
cs
cs.AI
cs.LG

参考文献与引用

  • NASA ADS
  • 谷歌学术搜索
  • 语义学者
a 导出 BibTeX 引用 加载中...

BibTeX 格式的引用

×
数据由提供:

收藏

BibSonomy logo Reddit logo

文献和引用工具

文献资源探索 (什么是资源探索?)
连接的论文 (什么是连接的论文?)
Litmaps (什么是 Litmaps?)
scite 智能引用 (什么是智能引用?)

与本文相关的代码,数据和媒体

alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)

演示

复制 (什么是复制?)
Hugging Face Spaces (什么是 Spaces?)
TXYZ.AI (什么是 TXYZ.AI?)

推荐器和搜索工具

影响之花 (什么是影响之花?)
核心推荐器 (什么是核心?)
IArxiv 推荐器 (什么是 IArxiv?)
  • 作者
  • 地点
  • 机构
  • 主题

arXivLabs:与社区合作伙伴的实验项目

arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。

与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。

有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.

这篇论文的哪些作者是支持者? | 禁用 MathJax (什么是 MathJax?)
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号