计算机科学 > 声音
[提交于 2025年8月27日
]
标题: IRMA数据集:伊朗古典音乐的结构化音频-MIDI语料库
标题: The IRMA Dataset: A Structured Audio-MIDI Corpus for Iranian Classical Music
摘要: 我们介绍了IRMA数据集(伊朗拉迪夫MIDI音频),这是一个多层次的开放访问语料库,旨在促进对伊朗古典音乐的计算研究,特别关注拉迪夫,这是一种结构化的调式旋律单元曲目,是教学和表演的核心。 该数据集结合了符号MIDI表示、乐句级音频-MIDI对齐、以PDF格式呈现的音乐学转录文本,以及从多位表演者和学者处整理的理论信息比较表格。 我们概述了多阶段的构建过程,包括片段注释、对齐方法以及用于引用单个音乐单元的结构化标识符系统。 当前版本包括Karimi的完整拉迪夫;Mirza Abdollah拉迪夫的MIDI文件和元数据;Davami的声乐拉迪夫片段,由Payvar和Fereyduni转录;以及一个专门部分,包含20世纪著名歌手演奏的tahrir装饰音的音频-MIDI示例。 尽管符号和分析组件以开放访问许可(CC BY-NC 4.0)发布,但一些参考的音频录音和第三方转录文本使用唱片信息进行引用,以使用户能够独立查找原始材料,待版权许可批准后。 作为学术档案和计算分析资源,该数据集支持民族音乐学、教学法、符号音频研究、文化遗产品保护以及自动转录和音乐生成等AI驱动任务的应用。 我们欢迎合作与反馈,以支持其持续改进,并更广泛地整合到音乐学和机器学习工作流程中。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.