A Breadth-First Catalog of Text Processing, Speech Processing and Multimodal Research in South Asian Languages

Gupta, Pranav

计算机科学 > 计算与语言

arXiv:2501.00029v1 (cs)

[提交于 2024年12月20日 ]

标题：南亚语言文本处理、语音处理和多模态研究的广度优先目录

标题： A Breadth-First Catalog of Text Processing, Speech Processing and Multimodal Research in South Asian Languages

Authors:Pranav Gupta

摘要：我们回顾了2022年1月至2024年10月期间关于南亚语言基于文本的语言处理、多模态模型以及语音处理的近期文献，并重点关注21种低资源南亚语言（即 Saraiki、Assamese、Balochi、Bhojpuri、Bodo、Burmese、Chhattisgarhi、Dhivehi、Gujarati、Kannada、Kashmiri、Konkani、Khasi、Malayalam、Meitei、Nepali、Odia、Pashto、Rajasthani、Sindhi 和 Telugu）进行了专题分析。通过逐步方法，结合大型语言模型 (LLMs) 的相关性分类和聚类，我们确定了趋势、挑战和未来的研究方向。我们的目标是为对研究南亚语言感兴趣的自然语言处理 (NLP) 研究人员提供南亚语言技术最新发展的广度优先概述。

摘要： We review the recent literature (January 2022- October 2024) in South Asian languages on text-based language processing, multimodal models, and speech processing, and provide a spotlight analysis focused on 21 low-resource South Asian languages, namely Saraiki, Assamese, Balochi, Bhojpuri, Bodo, Burmese, Chhattisgarhi, Dhivehi, Gujarati, Kannada, Kashmiri, Konkani, Khasi, Malayalam, Meitei, Nepali, Odia, Pashto, Rajasthani, Sindhi, and Telugu. We identify trends, challenges, and future research directions, using a step-wise approach that incorporates relevance classification and clustering based on large language models (LLMs). Our goal is to provide a breadth-first overview of the recent developments in South Asian language technologies to NLP researchers interested in working with South Asian languages.

主题：	计算与语言 (cs.CL) ; 信息检索 (cs.IR); 机器学习 (cs.LG)
引用方式：	arXiv:2501.00029 [cs.CL]
	(或者 arXiv:2501.00029v1 [cs.CL] 对于此版本)
	https://doi.org/10.48550/arXiv.2501.00029

提交历史

来自： Pranav Gupta [查看电子邮件]
[v1] 星期五， 2024 年 12 月 20 日 20:08:48 UTC (7,070 KB)

计算机科学 > 计算与语言

标题：南亚语言文本处理、语音处理和多模态研究的广度优先目录

标题： A Breadth-First Catalog of Text Processing, Speech Processing and Multimodal Research in South Asian Languages

提交历史

获取论文：

参考文献与引用

收藏

文献和引用工具

与本文相关的代码，数据和媒体

演示

推荐器和搜索工具

arXivLabs：与社区合作伙伴的实验项目

计算机科学 > 计算与语言

标题： 南亚语言文本处理、语音处理和多模态研究的广度优先目录 显示英文标题

标题： A Breadth-First Catalog of Text Processing, Speech Processing and Multimodal Research in South Asian Languages

提交历史

获取论文：

参考文献与引用

BibTeX 格式的引用

收藏

文献和引用工具

与本文相关的代码，数据和媒体

演示

推荐器和搜索工具

arXivLabs：与社区合作伙伴的实验项目

标题：南亚语言文本处理、语音处理和多模态研究的广度优先目录