计算机科学 > 计算机视觉与模式识别
[提交于 2025年6月3日
]
标题: 对比与压缩:学习短轨迹的轻量级嵌入
标题: Contrast & Compress: Learning Lightweight Embeddings for Short Trajectories
摘要: 能够以准确性和高效性检索语义和方向上相似的短程轨迹,是诸如运动预测和自主导航等下游应用的基础。 然而,现有的方法通常依赖于计算密集型的启发式算法或缺乏可解释性和可控性的潜在锚点表示。 在这项工作中,我们提出了一种新颖的框架,通过利用经过对比三元组损失训练的Transformer编码器来学习短轨迹的固定维度嵌入,强调了轨迹数据判别特征空间的重要性。 我们在对比学习范式内分析了余弦和基于FFT的相似性度量的影响,重点关注捕捉短期操作中特有的细微方向意图。 我们在Argoverse 2数据集上的实证评估表明,由余弦相似性目标塑造的嵌入在语义和方向属性上对轨迹的聚类效果优于基于FFT的基线,在检索任务中表现更佳。 值得注意的是,我们展示了紧凑型Transformer架构(即使使用低维嵌入,例如16维,但定性上甚至可以降至4维)在检索性能(minADE, minFDE)和计算开销之间取得了令人信服的平衡,与实时系统中对可扩展且可解释的运动先验的需求相一致。 由此产生的嵌入为轨迹数据提供了一种紧凑、语义丰富且高效的表示形式,为启发式相似性度量提供了一个稳健的替代方案,并为更透明和可控的运动预测管道铺平了道路。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.