Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > cs > arXiv:2411.01915v2

帮助 | 高级搜索

计算机科学 > 机器人技术

arXiv:2411.01915v2 (cs)
[提交于 2024年11月4日 (v1) ,最后修订 2025年5月21日 (此版本, v2)]

标题: RoboCrowd:通过众包扩展机器人数据收集

标题: RoboCrowd: Scaling Robot Data Collection through Crowdsourcing

Authors:Suvir Mirchandani, David D. Yuan, Kaylee Burns, Md Sazzad Islam, Tony Z. Zhao, Chelsea Finn, Dorsa Sadigh
摘要: 近年来,从大规模人类演示中进行模仿学习已成为训练机器人策略的一种有前景的范式。 然而,在收集大量人类演示方面,无论是收集时间还是获得专家操作员的访问权限,都存在显著负担。 我们引入了一种新的数据收集范式,RoboCrowd,它通过利用众包原则和激励设计来分担负载。 RoboCrowd有助于实现可扩展的数据收集,并促进更高效的机器人策略学习。 我们在ALOHA(Zhao等人,2023)之上构建了RoboCrowd——一个支持通过木偶操控进行数据收集的双臂平台——以探索在公共环境中众包现场演示的设计空间。 我们提出了三类激励机制,以吸引用户因不同动机而与系统互动:物质奖励、内在兴趣和社会比较。 我们通过包括物质奖励、引人入胜或具有挑战性的操作以及排行榜等游戏化元素的任务来实现这些激励。 我们在大学咖啡厅中进行了为期两周的大规模实地实验。 我们观察到用户对该系统的显著参与度——超过200名个人独立自愿提供总计超过800次交互会话。 我们的研究结果验证了所提出的激励机制作为塑造用户数据数量和质量的有效方式。 此外,我们证明了众包数据可以作为在专家演示上微调策略的有用预训练数据——与没有此数据相比,性能提升高达20%。 这些结果表明,通过精心实施众包和激励设计原则,RoboCrowd有可能减轻机器人数据收集的负担。
摘要: In recent years, imitation learning from large-scale human demonstrations has emerged as a promising paradigm for training robot policies. However, the burden of collecting large quantities of human demonstrations is significant in terms of collection time and the need for access to expert operators. We introduce a new data collection paradigm, RoboCrowd, which distributes the workload by utilizing crowdsourcing principles and incentive design. RoboCrowd helps enable scalable data collection and facilitates more efficient learning of robot policies. We build RoboCrowd on top of ALOHA (Zhao et al. 2023) -- a bimanual platform that supports data collection via puppeteering -- to explore the design space for crowdsourcing in-person demonstrations in a public environment. We propose three classes of incentive mechanisms to appeal to users' varying sources of motivation for interacting with the system: material rewards, intrinsic interest, and social comparison. We instantiate these incentives through tasks that include physical rewards, engaging or challenging manipulations, as well as gamification elements such as a leaderboard. We conduct a large-scale, two-week field experiment in which the platform is situated in a university cafe. We observe significant engagement with the system -- over 200 individuals independently volunteered to provide a total of over 800 interaction episodes. Our findings validate the proposed incentives as mechanisms for shaping users' data quantity and quality. Further, we demonstrate that the crowdsourced data can serve as useful pre-training data for policies fine-tuned on expert demonstrations -- boosting performance up to 20% compared to when this data is not available. These results suggest the potential for RoboCrowd to reduce the burden of robot data collection by carefully implementing crowdsourcing and incentive design principles.
评论: 21页,25幅图。2025年国际机器人与自动化会议(ICRA)
主题: 机器人技术 (cs.RO)
引用方式: arXiv:2411.01915 [cs.RO]
  (或者 arXiv:2411.01915v2 [cs.RO] 对于此版本)
  https://doi.org/10.48550/arXiv.2411.01915
通过 DataCite 发表的 arXiv DOI

提交历史

来自: Suvir Mirchandani [查看电子邮件]
[v1] 星期一, 2024 年 11 月 4 日 09:27:36 UTC (42,222 KB)
[v2] 星期三, 2025 年 5 月 21 日 17:16:09 UTC (32,981 KB)
全文链接:

获取论文:

    查看标题为《》的 PDF
  • 查看中文 PDF
  • 查看 PDF
  • TeX 源代码
  • 其他格式
许可图标 查看许可
当前浏览上下文:
cs.RO
< 上一篇   |   下一篇 >
新的 | 最近的 | 2024-11
切换浏览方式为:
cs

参考文献与引用

  • NASA ADS
  • 谷歌学术搜索
  • 语义学者
a 导出 BibTeX 引用 加载中...

BibTeX 格式的引用

×
数据由提供:

收藏

BibSonomy logo Reddit logo

文献和引用工具

文献资源探索 (什么是资源探索?)
连接的论文 (什么是连接的论文?)
Litmaps (什么是 Litmaps?)
scite 智能引用 (什么是智能引用?)

与本文相关的代码,数据和媒体

alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)

演示

复制 (什么是复制?)
Hugging Face Spaces (什么是 Spaces?)
TXYZ.AI (什么是 TXYZ.AI?)

推荐器和搜索工具

影响之花 (什么是影响之花?)
核心推荐器 (什么是核心?)
IArxiv 推荐器 (什么是 IArxiv?)
  • 作者
  • 地点
  • 机构
  • 主题

arXivLabs:与社区合作伙伴的实验项目

arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。

与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。

有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.

这篇论文的哪些作者是支持者? | 禁用 MathJax (什么是 MathJax?)
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号