Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > eess.AS

帮助 | 高级搜索

音频与语音处理

2025年08月 的作者和标题

总共 312 条目 : 1-50 51-100 101-150 151-200 ... 301-312
显示最多 50 每页条目: 较少 | 更多 | 所有
[1] arXiv:2508.00123 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]
标题: 旋律-歌词匹配的对比对齐损失
标题: Melody-Lyrics Matching with Contrastive Alignment Loss
Changhong Wang, Michel Olvera, Gaël Richard
评论: 10页,7图,3表。本工作已提交给IEEE以供可能发表
主题: 音频与语音处理 (eess.AS) ; 信息检索 (cs.IR)
[2] arXiv:2508.00240 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]
标题: 基于波形域神经网络的Ambisonics超分辨率
标题: Ambisonics Super-Resolution Using A Waveform-Domain Neural Network
Ismael Nawfal, Symeon Delikaris Manias, Mehrez Souden, Juha Merimaa, Joshua Atkins, Elisabeth McMullin, Shadi Pirhosseinloo, Daniel Phillips
主题: 音频与语音处理 (eess.AS) ; 声音 (cs.SD)
[3] arXiv:2508.00307 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]
标题: 波束成形的360°声音图:U-Net驱动的声源分割与定位
标题: Beamformed 360° Sound Maps: U-Net-Driven Acoustic Source Segmentation and Localization
Belman Jahir Rodriguez, Sergio F. Chevtchenko, Marcelo Herrera Martinez, Yeshwant Bethy, Saeed Afshar
主题: 音频与语音处理 (eess.AS) ; 人工智能 (cs.AI) ; 声音 (cs.SD) ; 信号处理 (eess.SP)
[4] arXiv:2508.00479 (交叉列表自 eess.AS) [中文pdf, pdf, 其他]
标题: 基于小波的时间-频率指纹特征提取方法在传统爱尔兰音乐中的应用
标题: Wavelet-Based Time-Frequency Fingerprinting for Feature Extraction of Traditional Irish Music
Noah Shore
评论: 硕士论文。论文的重点是信号指纹识别的基础技术
主题: 音频与语音处理 (eess.AS) ; 声音 (cs.SD) ; 信号处理 (eess.SP)
[5] arXiv:2508.00501 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]
标题: VR-托勒密:用于空间音频算法感知测试的虚拟环境
标题: VR-PTOLEMAIC: A Virtual Environment for the Perceptual Testing of Spatial Audio Algorithms
Paolo Ostan, Francesca Del Gaudio, Federico Miotello, Mirco Pezzoli, Fabio Antonacci
评论: 将出现在EAA论坛声学2025上
主题: 音频与语音处理 (eess.AS) ; 声音 (cs.SD)
[6] arXiv:2508.00509 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]
标题: 动态实时双二次格式适应用于沉浸式网络音乐表演
标题: Dynamic Real-Time Ambisonics Order Adaptation for Immersive Networked Music Performances
Paolo Ostan, Carlo Centofanti, Mirco Pezzoli, Alberto Bernardini, Claudia Rinaldi, Fabio Antonacci
评论: 将出现在EUSIPCO 2025上
主题: 音频与语音处理 (eess.AS)
[7] arXiv:2508.01034 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]
标题: 基于多头注意力的调制谱图与SSL融合用于虚假语音检测
标题: Fusion of Modulation Spectrogram and SSL with Multi-head Attention for Fake Speech Detection
Rishith Sadashiv T N, Abhishek Bedge, Saisha Suresh Bore, Jagabandhu Mishra, Mrinmoy Bhattacharjee, S R Mahadeva Prasanna
评论: 被APSIPA ASC 2025接收
主题: 音频与语音处理 (eess.AS)
[8] arXiv:2508.01467 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]
标题: 多粒度自适应时频注意力框架用于现实通信退化下的音频深度伪造检测
标题: Multi-Granularity Adaptive Time-Frequency Attention Framework for Audio Deepfake Detection under Real-World Communication Degradations
Haohan Shi, Xiyu Shi, Safak Dogan, Tianjin Huang, Yunxiao Zhang
主题: 音频与语音处理 (eess.AS)
[9] arXiv:2508.01576 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]
标题: Lumename:用于听力障碍者的可穿戴设备,具有个性化的基于机器学习的听觉检测和触觉-视觉警报
标题: Lumename: Wearable Device for Hearing Impaired with Personalized ML-Based Auditory Detection and Haptic-Visual Alerts
Jeanelle Dao, Jadelynn Dao
主题: 音频与语音处理 (eess.AS)
[10] arXiv:2508.01637 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]
标题: 一种无年龄限制的鲁棒说话人验证系统
标题: An Age-Agnostic System for Robust Speaker Verification
Jiusi Zheng, Vishwas Shetty, Natarajan Balaji Shankar, Abeer Alwan
评论: 被接受参加2025年国际语音会议儿童计算机交互研讨会
主题: 音频与语音处理 (eess.AS)
[11] arXiv:2508.01847 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]
标题: 测试时间训练用于语音增强
标题: Test-Time Training for Speech Enhancement
Avishkar Behera, Riya Ann Easow, Venkatesh Parvathala, K. Sri Rama Murty
评论: 被Interspeech 2025接收。5页,2图
主题: 音频与语音处理 (eess.AS) ; 机器学习 (cs.LG) ; 声音 (cs.SD)
[12] arXiv:2508.02112 (交叉列表自 eess.AS) [中文pdf, pdf, 其他]
标题: 长文本多说话人语音识别的词错误率定义和算法
标题: Word Error Rate Definitions and Algorithms for Long-Form Multi-talker Speech Recognition
Thilo von Neumann, Christoph Boeddeker, Marc Delcroix, Reinhold Haeb-Umbach
评论: 被接受用于IEEE音频、语音和语言处理汇刊(TASLP),第33卷
期刊参考: IEEE 语音、音频和语言处理汇刊,第 33 卷,第 3174-3188 页,2025
主题: 音频与语音处理 (eess.AS)
[13] arXiv:2508.02228 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]
标题: 使用大型语言模型引导自动语音识别解码器
标题: Guiding an Automatic Speech Recognition Decoder Using Large Language Models
Eyal Cohen (1), Bhiksha Raj (2), Joseph Keshet (1) ((1) Technion - Israel Institute of Technology, (2) Carnegie Mellon University)
评论: 11页,2图。本工作已提交给IEEE以可能发表
主题: 音频与语音处理 (eess.AS)
[14] arXiv:2508.02295 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]
标题: 无参考对抗性性别混淆语音
标题: Reference-free Adversarial Sex Obfuscation in Speech
Yangyang Qu, Michele Panariello, Massimiliano Todisco, Nicholas Evans
主题: 音频与语音处理 (eess.AS) ; 声音 (cs.SD)
[15] arXiv:2508.02483 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]
标题: 重新审视低频语音信号的隐私性:探索重采样方法、评估场景和说话人特征
标题: Revisiting the Privacy of Low-Frequency Speech Signals: Exploring Resampling Methods, Evaluation Scenarios, and Speaker Characteristics
Jule Pohlhausen, Jörg Bitzer
评论: 被SPSC 2025 - 第五届语音通信安全与隐私研讨会接收
主题: 音频与语音处理 (eess.AS)
[16] arXiv:2508.02849 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]
标题: SecoustiCodec:跨模态对齐的流式单编码本语音编解码器
标题: SecoustiCodec: Cross-Modal Aligned Streaming Single-Codecbook Speech Codec
Chunyu Qiang, Haoyu Wang, Cheng Gong, Tianrui Wang, Ruibo Fu, Tao Wang, Ruilong Chen, Jiangyan Yi, Zhengqi Wen, Chen Zhang, Longbiao Wang, Jianwu Dang, Jianhua Tao
主题: 音频与语音处理 (eess.AS) ; 人工智能 (cs.AI) ; 计算与语言 (cs.CL) ; 声音 (cs.SD)
[17] arXiv:2508.02974 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]
标题: 使用神经音频编解码器作为基础模型的噪声中实时喉部麦克风语音增强
标题: Real-time speech enhancement in noise for throat microphone using neural audio codec as foundation model
Julien Hauret, Thomas Joubaud, Éric Bavu
评论: 2页,2图
主题: 音频与语音处理 (eess.AS)
[18] arXiv:2508.03065 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]
标题: 快速移动声源算法
标题: Fast Algorithm for Moving Sound Source
Dong Yang
主题: 音频与语音处理 (eess.AS) ; 声音 (cs.SD)
[19] arXiv:2508.03087 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]
标题: 基于刚性球形麦克风阵列的核岭回归声场估计
标题: Kernel ridge regression based sound field estimation using a rigid spherical microphone array
Ryo Matsuda, Juliano G. C. Ribeiro, Hitoshi Akiyama, Jorge Trevino
评论: 本文已被接受至IEEE语音与音频处理应用研讨会(WASPAA)2025
主题: 音频与语音处理 (eess.AS)
[20] arXiv:2508.03190 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]
标题: PatchDSU:关键词检测中分布外泛化的不确定性建模
标题: PatchDSU: Uncertainty Modeling for Out of Distribution Generalization in Keyword Spotting
Bronya Roni Chernyak, Yael Segal, Yosi Shrem, Joseph Keshet
评论: 此作品已提交给IEEE以可能发表
主题: 音频与语音处理 (eess.AS) ; 机器学习 (cs.LG)
[21] arXiv:2508.03937 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]
标题: LCS-CTC:利用软对齐提高语音转录的鲁棒性
标题: LCS-CTC: Leveraging Soft Alignments to Enhance Phonetic Transcription Robustness
Zongli Ye, Jiachen Lian, Akshaj Gupta, Xuanru Zhou, Haodong Li, Krish Patel, Hwi Joo Park, Dingkun Zhou, Chenxu Guo, Shuhe Li, Sam Wang, Iris Zhou, Cheol Jun Cho, Zoe Ezzes, Jet M.J. Vonk, Brittany T. Morin, Rian Bogley, Lisa Wauters, Zachary A. Miller, Maria Luisa Gorno-Tempini, Gopala Anumanchipalli
评论: 2025 ASRU 正确作者名单
主题: 音频与语音处理 (eess.AS)
[22] arXiv:2508.04141 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]
标题: 并行GPT:为零样本文本到语音协调声学和语义信息的独立性和相互依赖性
标题: Parallel GPT: Harmonizing the Independence and Interdependence of Acoustic and Semantic Information for Zero-Shot Text-to-Speech
Jingyuan Xing, Zhipeng Li, Jialong Mai, Xiaofen Xing, Xiangmin Xu
评论: 提交至IEEE/ACM语音、音频和语言处理汇刊(TASLP)
主题: 音频与语音处理 (eess.AS) ; 声音 (cs.SD)
[23] arXiv:2508.04143 (交叉列表自 eess.AS) [中文pdf, pdf, 其他]
标题: 多语言语音深度伪造源追踪:首个基准测试
标题: Multilingual Source Tracing of Speech Deepfakes: A First Benchmark
Xi Xuan, Yang Xiao, Rohan Kumar Das, Tomi Kinnunen
评论: 被Interspeech SPSC 2025 - 第五届语音通信安全与隐私研讨会(口头报告)接受
主题: 音频与语音处理 (eess.AS) ; 计算与语言 (cs.CL) ; 声音 (cs.SD)
[24] arXiv:2508.04230 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]
标题: 面向可解释的情感识别:使用机器学习识别关键特征
标题: Towards interpretable emotion recognition: Identifying key features with machine learning
Yacouba Kaloga, Ina Kodrasi
期刊参考: 在《2025年欧洲噪声论坛会议录》中,马尔加,西班牙,2025年6月
主题: 音频与语音处理 (eess.AS) ; 声音 (cs.SD)
[25] arXiv:2508.04283 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]
标题: 一种多阶段低延迟增强系统用于助听器
标题: A Multi-stage Low-latency Enhancement System for Hearing Aids
Chengwei Ouyang, Kexin Fei, Haoshuai Zhou, Congxi Lu, Linkai Li
评论: 2页,1图,1表。已被ICASSP 2023接收
主题: 音频与语音处理 (eess.AS) ; 声音 (cs.SD)
[26] arXiv:2508.04333 (交叉列表自 eess.AS) [中文pdf, pdf, 其他]
标题: 基于HRTF定位线索的人形机器人双耳声音事件定位与检测神经网络
标题: Binaural Sound Event Localization and Detection Neural Network based on HRTF Localization Cues for Humanoid Robots
Gyeong-Tae Lee
评论: 200页
期刊参考: 博士论文,KAIST,2024
主题: 音频与语音处理 (eess.AS) ; 声音 (cs.SD)
[27] arXiv:2508.04425 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]
标题: 说话人验证的说话人文本因子分解嵌入文本适应
标题: Text adaptation for speaker verification with speaker-text factorized embeddings
Yexin Yang, Shuai Wang, Xun Gong, Yanmin Qian, Kai Yu
评论: ICASSP 2020
主题: 音频与语音处理 (eess.AS) ; 声音 (cs.SD)
[28] arXiv:2508.04430 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]
标题: 印度北方式声乐音乐中表达的旋律与节奏元素
标题: Melodic and Metrical Elements of Expressiveness in Hindustani Vocal Music
Yash Bhake, Ankit Anand, Preeti Rao
评论: 将出现在第26届国际音乐信息检索会议(ISMIR)论文集上,韩国大田,2025年
主题: 音频与语音处理 (eess.AS) ; 声音 (cs.SD)
[29] arXiv:2508.04512 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]
标题: 自动痴呆评估中的陷阱和限制
标题: Pitfalls and Limits in Automatic Dementia Assessment
Franziska Braun, Christopher Witzl, Andreas Erzigkeit, Hartmut Lehfeld, Thomas Hillemacher, Tobias Bocklet, Korbinian Riedhammer
评论: 被INTERSPEECH 2025接受
主题: 音频与语音处理 (eess.AS)
[30] arXiv:2508.04585 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]
标题: UniTalker:对话式语音-视觉合成
标题: UniTalker: Conversational Speech-Visual Synthesis
Yifan Hu, Rui Liu, Yi Ren, Xiang Yin, Haizhou Li
评论: 15页,8图,已被ACM MM 2025接收
主题: 音频与语音处理 (eess.AS)
[31] arXiv:2508.04857 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]
标题: 关键词检测与超匹配滤波器在小尺寸设备中的应用
标题: Keyword Spotting with Hyper-Matched Filters for Small Footprint Devices
Yael Segal-Feldman, Ann R. Bradlow, Matthew Goldrick, Joseph Keshet
评论: 预印本
主题: 音频与语音处理 (eess.AS) ; 机器学习 (cs.LG) ; 声音 (cs.SD)
[32] arXiv:2508.04887 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]
标题: 基于盲斜投影结合噪声白化的闭式连续相对传输函数向量估计
标题: Closed-Form Successive Relative Transfer Function Vector Estimation based on Blind Oblique Projection Incorporating Noise Whitening
Henri Gode, Simon Doclo
主题: 音频与语音处理 (eess.AS)
[33] arXiv:2508.04996 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]
标题: REF-VC:具有扩散变压器的鲁棒、表达和快速零样本语音转换
标题: REF-VC: Robust, Expressive and Fast Zero-Shot Voice Conversion with Diffusion Transformers
Yuepeng Jiang, Ziqian Ning, Shuai Wang, Chengjia Wang, Mengxiao Bi, Pengcheng Zhu, Zhonghua Fu, Lei Xie
主题: 音频与语音处理 (eess.AS)
[34] arXiv:2508.05055 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]
标题: MOVER:结合多个会议识别系统
标题: MOVER: Combining Multiple Meeting Recognition Systems
Naoyuki Kamo, Tsubasa Ochiai, Marc Delcroix, Tomohiro Nakatani
主题: 音频与语音处理 (eess.AS)
[35] arXiv:2508.05102 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]
标题: 失语症语音合成中的公平性:使用F5-TTS理解失语症语音克隆中的内在偏差
标题: Fairness in Dysarthric Speech Synthesis: Understanding Intrinsic Bias in Dysarthric Speech Cloning using F5-TTS
M Anuprabha, Krishna Gurugubelli, Anil Kumar Vuppala
评论: 被Interspeech 2025接收
主题: 音频与语音处理 (eess.AS) ; 人工智能 (cs.AI)
[36] arXiv:2508.05149 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]
标题: 低资源场景中的语音大语言模型:数据量需求以及预训练对高资源语言的影响
标题: Speech LLMs in Low-Resource Scenarios: Data Volume Requirements and the Impact of Pretraining on High-Resource Languages
Seraphina Fong, Marco Matassoni, Alessio Brutti
评论: 被Interspeech 2025接收。5页,2图,3表
主题: 音频与语音处理 (eess.AS) ; 人工智能 (cs.AI) ; 计算与语言 (cs.CL)
[37] arXiv:2508.05250 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]
标题: 语音和自然语言处理中的相似性排名隐私声明
标题: Privacy Disclosure of Similarity Rank in Speech and Language Processing
Tom Bäckström, Mohammad Hassan Vali, My Nguyen, Silas Rech
主题: 音频与语音处理 (eess.AS)
[38] arXiv:2508.05293 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]
标题: 基于单通道VAE的语音增强中语音和噪声潜在表示的研究
标题: Investigation of Speech and Noise Latent Representations in Single-channel VAE-based Speech Enhancement
Jiatong Li, Simon Doclo
评论: 5页,5图
主题: 音频与语音处理 (eess.AS)
[39] arXiv:2508.05835 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]
标题: NanoCodec:迈向高质量超快速语音大模型推理
标题: NanoCodec: Towards High-Quality Ultra Fast Speech LLM Inference
Edresson Casanova, Paarth Neekhara, Ryan Langman, Shehzeen Hussain, Subhankar Ghosh, Xuesong Yang, Ante Jukić, Jason Li, Boris Ginsburg
评论: 被国际语音语言会议2025接受
主题: 音频与语音处理 (eess.AS) ; 计算与语言 (cs.CL) ; 声音 (cs.SD)
[40] arXiv:2508.06271 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]
标题: EchoFree:面向超轻量级和高效的神经语音回声消除
标题: EchoFree: Towards Ultra Lightweight and Efficient Neural Acoustic Echo Cancellation
Xingchen Li, Boyi Kang, Ziqian Wang, Zihan Zhang, Mingshuai Liu, Zhonghua Fu, Lei Xie
主题: 音频与语音处理 (eess.AS)
[41] arXiv:2508.06284 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]
标题: 利用大语言模型进行可扩展的非侵入式语音质量评估
标题: Leveraging LLMs for Scalable Non-intrusive Speech Quality Assessment
Fredrik Cumlin, Xinyu Liang, Anubhab Ghosh, Saikat Chatterjee
评论: ECAI研讨会论文
主题: 音频与语音处理 (eess.AS)
[42] arXiv:2508.06310 (交叉列表自 eess.AS) [中文pdf, pdf, 其他]
标题: 基于混合模型和学习方法的抗干扰源定位与语音增强技术在无人机中的应用
标题: Egonoise Resilient Source Localization and Speech Enhancement for Drones Using a Hybrid Model and Learning-Based Approach
Yihsuan Wu, Yukai Chiu, Michael Anthony, Mingsian R. Bai
主题: 音频与语音处理 (eess.AS)
[43] arXiv:2508.06356 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]
标题: 语音匿名化的用例
标题: Use Cases for Voice Anonymization
Sarina Meyer, Ngoc Thang Vu
评论: 被SPSC 2025 - 第五届语音通信安全与隐私研讨会接收
主题: 音频与语音处理 (eess.AS)
[44] arXiv:2508.06405 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]
标题: 基于硬标签标准的声学非平稳性客观评估用于监督学习模型
标题: Acoustic Non-Stationarity Objective Assessment with Hard Label Criteria for Supervised Learning Models
Guilherme Zucatelli, Ricardo Barioni, Gabriela Dantas
评论: 正在审稿的稿件
主题: 音频与语音处理 (eess.AS) ; 信号处理 (eess.SP)
[45] arXiv:2508.06686 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]
标题: 可微分分组反馈延迟网络用于学习耦合体积声学
标题: Differentiable Grouped Feedback Delay Networks for Learning Coupled Volume Acoustics
Orchisama Das, Gloria Dal Santo, Sebastian J. Schlecht, Vesa Valimaki, Zoran Cvetkovic
主题: 音频与语音处理 (eess.AS)
[46] arXiv:2508.06840 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]
标题: FlowSE:基于流匹配的语音增强
标题: FlowSE: Flow Matching-based Speech Enhancement
Seonggyu Lee, Sein Cheong, Sangwook Han, Jong Won Shin
评论: 发表于ICASSP 2025
主题: 音频与语音处理 (eess.AS) ; 信号处理 (eess.SP)
[47] arXiv:2508.06842 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]
标题: 基于级联两个流的语音增强
标题: Speech Enhancement based on cascaded two flows
Seonggyu Lee, Sein Cheong, Sangwook Han, Kihyuk Kim, Jong Won Shin
评论: 被Interspeech 2025接收
主题: 音频与语音处理 (eess.AS) ; 信号处理 (eess.SP)
[48] arXiv:2508.06928 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]
标题: 使用远程麦克风的助听器应用中基于头部方向的通道选择方法
标题: Head-steered channel selection method for hearing aid applications using remote microphones
Vasudha Sathyapriyan, Michael S. Pedersen, Mike Brookes, Jan Østergaard, Patrick A. Naylor, Jesper Jensen
评论: 11页,8图
主题: 音频与语音处理 (eess.AS)
[49] arXiv:2508.07014 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]
标题: TurboBias:由GPU加速的短语增强树支持的通用ASR上下文偏差
标题: TurboBias: Universal ASR Context-Biasing powered by GPU-accelerated Phrase-Boosting Tree
Andrei Andrusenko, Vladimir Bataev, Lilit Grigoryan, Vitaly Lavrukhin, Boris Ginsburg
评论: 被ASRU 2025接收
主题: 音频与语音处理 (eess.AS) ; 人工智能 (cs.AI) ; 计算与语言 (cs.CL) ; 声音 (cs.SD)
[50] arXiv:2508.07219 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]
标题: ParaNoise-SV:具有语音增强和噪声提取并行联合学习的噪声鲁棒说话人验证综合方法
标题: ParaNoise-SV: Integrated Approach for Noise-Robust Speaker Verification with Parallel Joint Learning of Speech Enhancement and Noise Extraction
Minu Kim, Kangwook Jang, Hoirin Kim
评论: 5页,3图,已被Interspeech 2025接收
主题: 音频与语音处理 (eess.AS) ; 声音 (cs.SD)
总共 312 条目 : 1-50 51-100 101-150 151-200 ... 301-312
显示最多 50 每页条目: 较少 | 更多 | 所有
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号