电气工程与系统科学 > 音频与语音处理
[提交于 2025年8月1日
]
标题: 动态实时双二次格式适应用于沉浸式网络音乐表演
标题: Dynamic Real-Time Ambisonics Order Adaptation for Immersive Networked Music Performances
摘要: 高级远程应用,如网络音乐表演(NMP),需要解决方案来保证用户之间的沉浸式真实世界般的交互。 因此,采用空间音频格式,如Ambisonics,是让用户体验沉浸式声学场景的基础。 Ambisonics编码的阶数越高,声音场景的再现精度就越高,从而在增加沉浸感的同时,也增加了音频通道的数量,进而提高了带宽需求和对网络缺陷(例如延迟、抖动和丢包)的敏感性。 这些因素对互动音乐会话构成了重大挑战,因为它们需要高空间保真度和低端到端延迟。 我们提出了一种实时自适应的高阶Ambisonics策略,该策略持续监控网络吞吐量并动态调整Ambisonics阶数。 当可用带宽低于预设阈值时,阶数会降低以防止音频中断;一旦条件恢复,就会重新回到较高阶数,从而在沉浸感和可靠性之间取得平衡。 基于MUSHRA的评估表明,这种自适应方法在带宽受限的NMP场景中具有保证用户体验的潜力。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.