计算机科学 > 图形学
[提交于 2025年3月31日
]
标题: 集体行为模仿学习(CBIL):来自真实视频的鱼类研究
标题: CBIL: Collective Behavior Imitation Learning for Fish from Real Videos
摘要: 再现真实的群体行为既引人入胜又极具挑战性。传统的基于规则的方法依赖手工设计的原则,限制了生成的群体行为的运动多样性和真实性。近期的模仿学习方法虽然从数据中学习,但通常需要真实的运动轨迹,并且在高密度且运动无序的群体中往往难以保证真实性。本文提出了一种可扩展的方法——集体行为模仿学习(CBIL),用于直接从视频中学习鱼群行为,而无需依赖捕获的运动轨迹。我们的方法首先利用视频表示学习,其中掩码视频自动编码器(MVAE)以自监督的方式从视频输入中提取隐状态。MVAE有效地将二维观察映射到紧凑且具有表现力的隐状态,以便进入模仿学习阶段。然后,我们提出了一种新的对抗模仿学习方法,以有效捕捉鱼群复杂运动,允许在潜在空间中高效地模仿运动模式分布。该方法还结合了生物启发奖励和先验知识来正则化和稳定训练过程。训练完成后,CBIL可以使用学到的群体运动先验来进行各种动画任务。我们进一步展示了它在不同物种中的有效性。最后,我们演示了该系统在从野外视频中检测异常鱼行为的应用。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.