计算机科学 > 声音
[提交于 2025年9月1日
]
标题: AudioMOS 挑战赛 2025
标题: The AudioMOS Challenge 2025
摘要: 这是AudioMOS Challenge 2025的总结论文,这是首个针对合成音频的自动主观质量预测的挑战。 该挑战包括三个赛道。 第一个赛道旨在根据整体质量和文本对齐度来评估文本到音乐的样本。 第二个赛道基于Meta Audiobox的四个评估维度,测试集包括文本到语音、文本到音频和文本到音乐的样本。 第三个赛道关注不同采样率下的合成语音质量评估。 该挑战吸引了来自学术界和工业界的24支独特团队,确认了对基线的改进。 此次挑战的结果有望促进音频生成系统自动评估领域的开发和进展。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.