Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > cs > arXiv:1909.07869

帮助 | 高级搜索

计算机科学 > 机器学习

arXiv:1909.07869 (cs)
[提交于 2019年9月17日 (v1) ,最后修订 2020年8月22日 (此版本, v3)]

标题: 可视化运动控制优化景观

标题: Visualizing Movement Control Optimization Landscapes

Authors:Perttu Hämäläinen, Juuso Toikka, Amin Babadi, C. Karen Liu
摘要: 大量动画研究集中于运动控制的优化,无论是作为动作序列还是策略参数。然而,由于目标函数的解析表达式通常不可用,我们对这些优化问题的理解受到限制。基于最近关于分析神经网络训练的研究,我们贡献了高维控制优化景观的新可视化;这为我们提供了对为什么控制优化困难以及为什么像早期终止和基于样条的动作参数化等常见做法可以简化优化的原因的洞察。例如,我们的实验表明,随着轨迹变长,轨迹优化可能变得越来越病态,但将控制参数化为部分目标状态——例如,使用PD控制器将目标角度转换为扭矩——可以作为一种有效的预条件器。我们的可视化和定量实证数据还表明,对于长时间规划范围,神经网络策略优化比轨迹优化表现得更好。我们的工作推进了对运动优化的理解,我们的可视化也应在教育应用中提供价值。
摘要: A large body of animation research focuses on optimization of movement control, either as action sequences or policy parameters. However, as closed-form expressions of the objective functions are often not available, our understanding of the optimization problems is limited. Building on recent work on analyzing neural network training, we contribute novel visualizations of high-dimensional control optimization landscapes; this yields insights into why control optimization is hard and why common practices like early termination and spline-based action parameterizations make optimization easier. For example, our experiments show how trajectory optimization can become increasingly ill-conditioned with longer trajectories, but parameterizing control as partial target states---e.g., target angles converted to torques using a PD-controller---can act as an efficient preconditioner. Both our visualizations and quantitative empirical data also indicate that neural network policy optimization scales better than trajectory optimization for long planning horizons. Our work advances the understanding of movement optimization and our visualizations should also provide value in educational use.
评论: 已被IEEE Transactions on Visualization and Computer Graphics (IEEE TVCG) 接收
主题: 机器学习 (cs.LG) ; 机器学习 (stat.ML)
引用方式: arXiv:1909.07869 [cs.LG]
  (或者 arXiv:1909.07869v3 [cs.LG] 对于此版本)
  https://doi.org/10.48550/arXiv.1909.07869
通过 DataCite 发表的 arXiv DOI

提交历史

来自: Amin Babadi [查看电子邮件]
[v1] 星期二, 2019 年 9 月 17 日 15:02:50 UTC (7,163 KB)
[v2] 星期三, 2019 年 9 月 18 日 06:42:11 UTC (7,163 KB)
[v3] 星期六, 2020 年 8 月 22 日 07:42:56 UTC (34,104 KB)
全文链接:

获取论文:

    查看标题为《》的 PDF
  • 查看中文 PDF
  • 查看 PDF
  • TeX 源代码
查看许可
当前浏览上下文:
cs.LG
< 上一篇   |   下一篇 >
新的 | 最近的 | 2019-09
切换浏览方式为:
cs
stat
stat.ML

参考文献与引用

  • NASA ADS
  • 谷歌学术搜索
  • 语义学者
a 导出 BibTeX 引用 加载中...

BibTeX 格式的引用

×
数据由提供:

收藏

BibSonomy logo Reddit logo

文献和引用工具

文献资源探索 (什么是资源探索?)
连接的论文 (什么是连接的论文?)
Litmaps (什么是 Litmaps?)
scite 智能引用 (什么是智能引用?)

与本文相关的代码,数据和媒体

alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)

演示

复制 (什么是复制?)
Hugging Face Spaces (什么是 Spaces?)
TXYZ.AI (什么是 TXYZ.AI?)

推荐器和搜索工具

影响之花 (什么是影响之花?)
核心推荐器 (什么是核心?)
IArxiv 推荐器 (什么是 IArxiv?)
  • 作者
  • 地点
  • 机构
  • 主题

arXivLabs:与社区合作伙伴的实验项目

arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。

与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。

有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.

这篇论文的哪些作者是支持者? | 禁用 MathJax (什么是 MathJax?)
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号