数学 > 数值分析
[提交于 2025年7月16日
]
标题: 保持节奏继续:具有动量的自动鼓乐转录
标题: Keep the beat going: Automatic drum transcription with momentum
摘要: 一种简单且可解释的方法是通过使用部分固定的非负矩阵分解来对录制的音乐作品的幅度谱图进行分解,从而实现自动鼓声转录。 优化非负矩阵分解有两种自然方式,包括乘法更新规则和带有动量的投影梯度下降。 这些方法在经验准确性与理论收敛保证方面有所不同。 本文总结了这些方法及其时间复杂度,并将这些方法应用于ENST-Drums数据集以及作者乐队的原始录音,根据真实鼓声标注评估其经验准确性。 结果表明,带有动量的投影梯度下降在固定运行时间内能够获得更高的准确性,并且满足更强的收敛保证。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.