音频与语音处理

2025年08月的作者和标题

总共 312 条目 : 1-50 51-100 101-150 151-200 ... 301-312

显示最多 50 每页条目：较少 | 更多 | 所有

[1] arXiv:2508.00123 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]: 标题：旋律-歌词匹配的对比对齐损失

标题： Melody-Lyrics Matching with Contrastive Alignment Loss

Changhong Wang, Michel Olvera, Gaël Richard

评论： 10页，7图，3表。本工作已提交给IEEE以供可能发表

主题：音频与语音处理 (eess.AS) ; 信息检索 (cs.IR)
[2] arXiv:2508.00240 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]: 标题：基于波形域神经网络的Ambisonics超分辨率

标题： Ambisonics Super-Resolution Using A Waveform-Domain Neural Network

Ismael Nawfal, Symeon Delikaris Manias, Mehrez Souden, Juha Merimaa, Joshua Atkins, Elisabeth McMullin, Shadi Pirhosseinloo, Daniel Phillips

主题：音频与语音处理 (eess.AS) ; 声音 (cs.SD)
[3] arXiv:2508.00307 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]: 标题：波束成形的360°声音图：U-Net驱动的声源分割与定位

标题： Beamformed 360° Sound Maps: U-Net-Driven Acoustic Source Segmentation and Localization

Belman Jahir Rodriguez, Sergio F. Chevtchenko, Marcelo Herrera Martinez, Yeshwant Bethy, Saeed Afshar

主题：音频与语音处理 (eess.AS) ; 人工智能 (cs.AI) ; 声音 (cs.SD) ; 信号处理 (eess.SP)
[4] arXiv:2508.00479 (交叉列表自 eess.AS) [中文pdf, pdf, 其他]: 标题：基于小波的时间-频率指纹特征提取方法在传统爱尔兰音乐中的应用

标题： Wavelet-Based Time-Frequency Fingerprinting for Feature Extraction of Traditional Irish Music

Noah Shore

评论：硕士论文。论文的重点是信号指纹识别的基础技术

主题：音频与语音处理 (eess.AS) ; 声音 (cs.SD) ; 信号处理 (eess.SP)
[5] arXiv:2508.00501 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]: 标题： VR-托勒密：用于空间音频算法感知测试的虚拟环境

标题： VR-PTOLEMAIC: A Virtual Environment for the Perceptual Testing of Spatial Audio Algorithms

Paolo Ostan, Francesca Del Gaudio, Federico Miotello, Mirco Pezzoli, Fabio Antonacci

评论：将出现在EAA论坛声学2025上

主题：音频与语音处理 (eess.AS) ; 声音 (cs.SD)
[6] arXiv:2508.00509 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]: 标题：动态实时双二次格式适应用于沉浸式网络音乐表演

标题： Dynamic Real-Time Ambisonics Order Adaptation for Immersive Networked Music Performances

Paolo Ostan, Carlo Centofanti, Mirco Pezzoli, Alberto Bernardini, Claudia Rinaldi, Fabio Antonacci

评论：将出现在EUSIPCO 2025上

主题：音频与语音处理 (eess.AS)
[7] arXiv:2508.01034 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]: 标题：基于多头注意力的调制谱图与SSL融合用于虚假语音检测

标题： Fusion of Modulation Spectrogram and SSL with Multi-head Attention for Fake Speech Detection

Rishith Sadashiv T N, Abhishek Bedge, Saisha Suresh Bore, Jagabandhu Mishra, Mrinmoy Bhattacharjee, S R Mahadeva Prasanna

评论：被APSIPA ASC 2025接收

主题：音频与语音处理 (eess.AS)
[8] arXiv:2508.01467 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]: 标题：多粒度自适应时频注意力框架用于现实通信退化下的音频深度伪造检测

标题： Multi-Granularity Adaptive Time-Frequency Attention Framework for Audio Deepfake Detection under Real-World Communication Degradations

Haohan Shi, Xiyu Shi, Safak Dogan, Tianjin Huang, Yunxiao Zhang

主题：音频与语音处理 (eess.AS)
[9] arXiv:2508.01576 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]: 标题： Lumename：用于听力障碍者的可穿戴设备，具有个性化的基于机器学习的听觉检测和触觉-视觉警报

标题： Lumename: Wearable Device for Hearing Impaired with Personalized ML-Based Auditory Detection and Haptic-Visual Alerts

Jeanelle Dao, Jadelynn Dao

主题：音频与语音处理 (eess.AS)
[10] arXiv:2508.01637 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]: 标题：一种无年龄限制的鲁棒说话人验证系统

标题： An Age-Agnostic System for Robust Speaker Verification

Jiusi Zheng, Vishwas Shetty, Natarajan Balaji Shankar, Abeer Alwan

评论：被接受参加2025年国际语音会议儿童计算机交互研讨会

主题：音频与语音处理 (eess.AS)
[11] arXiv:2508.01847 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]: 标题：测试时间训练用于语音增强

标题： Test-Time Training for Speech Enhancement

Avishkar Behera, Riya Ann Easow, Venkatesh Parvathala, K. Sri Rama Murty

评论：被Interspeech 2025接收。5页，2图

主题：音频与语音处理 (eess.AS) ; 机器学习 (cs.LG) ; 声音 (cs.SD)
[12] arXiv:2508.02112 (交叉列表自 eess.AS) [中文pdf, pdf, 其他]: 标题：长文本多说话人语音识别的词错误率定义和算法

标题： Word Error Rate Definitions and Algorithms for Long-Form Multi-talker Speech Recognition

Thilo von Neumann, Christoph Boeddeker, Marc Delcroix, Reinhold Haeb-Umbach

评论：被接受用于IEEE音频、语音和语言处理汇刊（TASLP），第33卷

期刊参考： IEEE 语音、音频和语言处理汇刊，第 33 卷，第 3174-3188 页，2025

主题：音频与语音处理 (eess.AS)
[13] arXiv:2508.02228 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]: 标题：使用大型语言模型引导自动语音识别解码器

标题： Guiding an Automatic Speech Recognition Decoder Using Large Language Models

Eyal Cohen (1), Bhiksha Raj (2), Joseph Keshet (1) ((1) Technion - Israel Institute of Technology, (2) Carnegie Mellon University)

评论： 11页，2图。本工作已提交给IEEE以可能发表

主题：音频与语音处理 (eess.AS)
[14] arXiv:2508.02295 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]: 标题：无参考对抗性性别混淆语音

标题： Reference-free Adversarial Sex Obfuscation in Speech

Yangyang Qu, Michele Panariello, Massimiliano Todisco, Nicholas Evans

主题：音频与语音处理 (eess.AS) ; 声音 (cs.SD)
[15] arXiv:2508.02483 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]: 标题：重新审视低频语音信号的隐私性：探索重采样方法、评估场景和说话人特征

标题： Revisiting the Privacy of Low-Frequency Speech Signals: Exploring Resampling Methods, Evaluation Scenarios, and Speaker Characteristics

Jule Pohlhausen, Jörg Bitzer

评论：被SPSC 2025 - 第五届语音通信安全与隐私研讨会接收

主题：音频与语音处理 (eess.AS)
[16] arXiv:2508.02849 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]: 标题： SecoustiCodec：跨模态对齐的流式单编码本语音编解码器

标题： SecoustiCodec: Cross-Modal Aligned Streaming Single-Codecbook Speech Codec

Chunyu Qiang, Haoyu Wang, Cheng Gong, Tianrui Wang, Ruibo Fu, Tao Wang, Ruilong Chen, Jiangyan Yi, Zhengqi Wen, Chen Zhang, Longbiao Wang, Jianwu Dang, Jianhua Tao

主题：音频与语音处理 (eess.AS) ; 人工智能 (cs.AI) ; 计算与语言 (cs.CL) ; 声音 (cs.SD)
[17] arXiv:2508.02974 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]: 标题：使用神经音频编解码器作为基础模型的噪声中实时喉部麦克风语音增强

标题： Real-time speech enhancement in noise for throat microphone using neural audio codec as foundation model

Julien Hauret, Thomas Joubaud, Éric Bavu

评论： 2页，2图

主题：音频与语音处理 (eess.AS)
[18] arXiv:2508.03065 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]: 标题：快速移动声源算法

标题： Fast Algorithm for Moving Sound Source

Dong Yang

主题：音频与语音处理 (eess.AS) ; 声音 (cs.SD)
[19] arXiv:2508.03087 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]: 标题：基于刚性球形麦克风阵列的核岭回归声场估计

标题： Kernel ridge regression based sound field estimation using a rigid spherical microphone array

Ryo Matsuda, Juliano G. C. Ribeiro, Hitoshi Akiyama, Jorge Trevino

评论：本文已被接受至IEEE语音与音频处理应用研讨会（WASPAA）2025

主题：音频与语音处理 (eess.AS)
[20] arXiv:2508.03190 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]: 标题： PatchDSU：关键词检测中分布外泛化的不确定性建模

标题： PatchDSU: Uncertainty Modeling for Out of Distribution Generalization in Keyword Spotting

Bronya Roni Chernyak, Yael Segal, Yosi Shrem, Joseph Keshet

评论：此作品已提交给IEEE以可能发表

主题：音频与语音处理 (eess.AS) ; 机器学习 (cs.LG)
[21] arXiv:2508.03937 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]: 标题： LCS-CTC：利用软对齐提高语音转录的鲁棒性

标题： LCS-CTC: Leveraging Soft Alignments to Enhance Phonetic Transcription Robustness

Zongli Ye, Jiachen Lian, Akshaj Gupta, Xuanru Zhou, Haodong Li, Krish Patel, Hwi Joo Park, Dingkun Zhou, Chenxu Guo, Shuhe Li, Sam Wang, Iris Zhou, Cheol Jun Cho, Zoe Ezzes, Jet M.J. Vonk, Brittany T. Morin, Rian Bogley, Lisa Wauters, Zachary A. Miller, Maria Luisa Gorno-Tempini, Gopala Anumanchipalli

评论： 2025 ASRU 正确作者名单

主题：音频与语音处理 (eess.AS)
[22] arXiv:2508.04141 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]: 标题：并行GPT：为零样本文本到语音协调声学和语义信息的独立性和相互依赖性

标题： Parallel GPT: Harmonizing the Independence and Interdependence of Acoustic and Semantic Information for Zero-Shot Text-to-Speech

Jingyuan Xing, Zhipeng Li, Jialong Mai, Xiaofen Xing, Xiangmin Xu

评论：提交至IEEE/ACM语音、音频和语言处理汇刊（TASLP）

主题：音频与语音处理 (eess.AS) ; 声音 (cs.SD)
[23] arXiv:2508.04143 (交叉列表自 eess.AS) [中文pdf, pdf, 其他]: 标题：多语言语音深度伪造源追踪：首个基准测试

标题： Multilingual Source Tracing of Speech Deepfakes: A First Benchmark

Xi Xuan, Yang Xiao, Rohan Kumar Das, Tomi Kinnunen

评论：被Interspeech SPSC 2025 - 第五届语音通信安全与隐私研讨会（口头报告）接受

主题：音频与语音处理 (eess.AS) ; 计算与语言 (cs.CL) ; 声音 (cs.SD)
[24] arXiv:2508.04230 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]: 标题：面向可解释的情感识别：使用机器学习识别关键特征

标题： Towards interpretable emotion recognition: Identifying key features with machine learning

Yacouba Kaloga, Ina Kodrasi

期刊参考：在《2025年欧洲噪声论坛会议录》中，马尔加，西班牙，2025年6月

主题：音频与语音处理 (eess.AS) ; 声音 (cs.SD)
[25] arXiv:2508.04283 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]: 标题：一种多阶段低延迟增强系统用于助听器

标题： A Multi-stage Low-latency Enhancement System for Hearing Aids

Chengwei Ouyang, Kexin Fei, Haoshuai Zhou, Congxi Lu, Linkai Li

评论： 2页，1图，1表。已被ICASSP 2023接收

主题：音频与语音处理 (eess.AS) ; 声音 (cs.SD)
[26] arXiv:2508.04333 (交叉列表自 eess.AS) [中文pdf, pdf, 其他]: 标题：基于HRTF定位线索的人形机器人双耳声音事件定位与检测神经网络

标题： Binaural Sound Event Localization and Detection Neural Network based on HRTF Localization Cues for Humanoid Robots

Gyeong-Tae Lee

评论： 200页

期刊参考：博士论文，KAIST，2024

主题：音频与语音处理 (eess.AS) ; 声音 (cs.SD)
[27] arXiv:2508.04425 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]: 标题：说话人验证的说话人文本因子分解嵌入文本适应

标题： Text adaptation for speaker verification with speaker-text factorized embeddings

Yexin Yang, Shuai Wang, Xun Gong, Yanmin Qian, Kai Yu

评论： ICASSP 2020

主题：音频与语音处理 (eess.AS) ; 声音 (cs.SD)
[28] arXiv:2508.04430 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]: 标题：印度北方式声乐音乐中表达的旋律与节奏元素

标题： Melodic and Metrical Elements of Expressiveness in Hindustani Vocal Music

Yash Bhake, Ankit Anand, Preeti Rao

评论：将出现在第26届国际音乐信息检索会议（ISMIR）论文集上，韩国大田，2025年

主题：音频与语音处理 (eess.AS) ; 声音 (cs.SD)
[29] arXiv:2508.04512 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]: 标题：自动痴呆评估中的陷阱和限制

标题： Pitfalls and Limits in Automatic Dementia Assessment

Franziska Braun, Christopher Witzl, Andreas Erzigkeit, Hartmut Lehfeld, Thomas Hillemacher, Tobias Bocklet, Korbinian Riedhammer

评论：被INTERSPEECH 2025接受

主题：音频与语音处理 (eess.AS)
[30] arXiv:2508.04585 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]: 标题： UniTalker：对话式语音-视觉合成

标题： UniTalker: Conversational Speech-Visual Synthesis

Yifan Hu, Rui Liu, Yi Ren, Xiang Yin, Haizhou Li

评论： 15页，8图，已被ACM MM 2025接收

主题：音频与语音处理 (eess.AS)
[31] arXiv:2508.04857 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]: 标题：关键词检测与超匹配滤波器在小尺寸设备中的应用

标题： Keyword Spotting with Hyper-Matched Filters for Small Footprint Devices

Yael Segal-Feldman, Ann R. Bradlow, Matthew Goldrick, Joseph Keshet

评论：预印本

主题：音频与语音处理 (eess.AS) ; 机器学习 (cs.LG) ; 声音 (cs.SD)
[32] arXiv:2508.04887 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]: 标题：基于盲斜投影结合噪声白化的闭式连续相对传输函数向量估计

标题： Closed-Form Successive Relative Transfer Function Vector Estimation based on Blind Oblique Projection Incorporating Noise Whitening

Henri Gode, Simon Doclo

主题：音频与语音处理 (eess.AS)
[33] arXiv:2508.04996 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]: 标题： REF-VC：具有扩散变压器的鲁棒、表达和快速零样本语音转换

标题： REF-VC: Robust, Expressive and Fast Zero-Shot Voice Conversion with Diffusion Transformers

Yuepeng Jiang, Ziqian Ning, Shuai Wang, Chengjia Wang, Mengxiao Bi, Pengcheng Zhu, Zhonghua Fu, Lei Xie

主题：音频与语音处理 (eess.AS)
[34] arXiv:2508.05055 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]: 标题： MOVER：结合多个会议识别系统

标题： MOVER: Combining Multiple Meeting Recognition Systems

Naoyuki Kamo, Tsubasa Ochiai, Marc Delcroix, Tomohiro Nakatani

主题：音频与语音处理 (eess.AS)
[35] arXiv:2508.05102 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]: 标题：失语症语音合成中的公平性：使用F5-TTS理解失语症语音克隆中的内在偏差

标题： Fairness in Dysarthric Speech Synthesis: Understanding Intrinsic Bias in Dysarthric Speech Cloning using F5-TTS

M Anuprabha, Krishna Gurugubelli, Anil Kumar Vuppala

评论：被Interspeech 2025接收

主题：音频与语音处理 (eess.AS) ; 人工智能 (cs.AI)
[36] arXiv:2508.05149 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]: 标题：低资源场景中的语音大语言模型：数据量需求以及预训练对高资源语言的影响

标题： Speech LLMs in Low-Resource Scenarios: Data Volume Requirements and the Impact of Pretraining on High-Resource Languages

Seraphina Fong, Marco Matassoni, Alessio Brutti

评论：被Interspeech 2025接收。5页，2图，3表

主题：音频与语音处理 (eess.AS) ; 人工智能 (cs.AI) ; 计算与语言 (cs.CL)
[37] arXiv:2508.05250 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]: 标题：语音和自然语言处理中的相似性排名隐私声明

标题： Privacy Disclosure of Similarity Rank in Speech and Language Processing

Tom Bäckström, Mohammad Hassan Vali, My Nguyen, Silas Rech

主题：音频与语音处理 (eess.AS)
[38] arXiv:2508.05293 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]: 标题：基于单通道VAE的语音增强中语音和噪声潜在表示的研究

标题： Investigation of Speech and Noise Latent Representations in Single-channel VAE-based Speech Enhancement

Jiatong Li, Simon Doclo

评论： 5页，5图

主题：音频与语音处理 (eess.AS)
[39] arXiv:2508.05835 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]: 标题： NanoCodec：迈向高质量超快速语音大模型推理

标题： NanoCodec: Towards High-Quality Ultra Fast Speech LLM Inference

Edresson Casanova, Paarth Neekhara, Ryan Langman, Shehzeen Hussain, Subhankar Ghosh, Xuesong Yang, Ante Jukić, Jason Li, Boris Ginsburg

评论：被国际语音语言会议2025接受

主题：音频与语音处理 (eess.AS) ; 计算与语言 (cs.CL) ; 声音 (cs.SD)
[40] arXiv:2508.06271 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]: 标题： EchoFree：面向超轻量级和高效的神经语音回声消除

标题： EchoFree: Towards Ultra Lightweight and Efficient Neural Acoustic Echo Cancellation

Xingchen Li, Boyi Kang, Ziqian Wang, Zihan Zhang, Mingshuai Liu, Zhonghua Fu, Lei Xie

主题：音频与语音处理 (eess.AS)
[41] arXiv:2508.06284 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]: 标题：利用大语言模型进行可扩展的非侵入式语音质量评估

标题： Leveraging LLMs for Scalable Non-intrusive Speech Quality Assessment

Fredrik Cumlin, Xinyu Liang, Anubhab Ghosh, Saikat Chatterjee

评论： ECAI研讨会论文

主题：音频与语音处理 (eess.AS)
[42] arXiv:2508.06310 (交叉列表自 eess.AS) [中文pdf, pdf, 其他]: 标题：基于混合模型和学习方法的抗干扰源定位与语音增强技术在无人机中的应用

标题： Egonoise Resilient Source Localization and Speech Enhancement for Drones Using a Hybrid Model and Learning-Based Approach

Yihsuan Wu, Yukai Chiu, Michael Anthony, Mingsian R. Bai

主题：音频与语音处理 (eess.AS)
[43] arXiv:2508.06356 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]: 标题：语音匿名化的用例

标题： Use Cases for Voice Anonymization

Sarina Meyer, Ngoc Thang Vu

评论：被SPSC 2025 - 第五届语音通信安全与隐私研讨会接收

主题：音频与语音处理 (eess.AS)
[44] arXiv:2508.06405 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]: 标题：基于硬标签标准的声学非平稳性客观评估用于监督学习模型

标题： Acoustic Non-Stationarity Objective Assessment with Hard Label Criteria for Supervised Learning Models

Guilherme Zucatelli, Ricardo Barioni, Gabriela Dantas

评论：正在审稿的稿件

主题：音频与语音处理 (eess.AS) ; 信号处理 (eess.SP)
[45] arXiv:2508.06686 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]: 标题：可微分分组反馈延迟网络用于学习耦合体积声学

标题： Differentiable Grouped Feedback Delay Networks for Learning Coupled Volume Acoustics

Orchisama Das, Gloria Dal Santo, Sebastian J. Schlecht, Vesa Valimaki, Zoran Cvetkovic

主题：音频与语音处理 (eess.AS)
[46] arXiv:2508.06840 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]: 标题： FlowSE：基于流匹配的语音增强

标题： FlowSE: Flow Matching-based Speech Enhancement

Seonggyu Lee, Sein Cheong, Sangwook Han, Jong Won Shin

评论：发表于ICASSP 2025

主题：音频与语音处理 (eess.AS) ; 信号处理 (eess.SP)
[47] arXiv:2508.06842 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]: 标题：基于级联两个流的语音增强

标题： Speech Enhancement based on cascaded two flows

Seonggyu Lee, Sein Cheong, Sangwook Han, Kihyuk Kim, Jong Won Shin

评论：被Interspeech 2025接收

主题：音频与语音处理 (eess.AS) ; 信号处理 (eess.SP)
[48] arXiv:2508.06928 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]: 标题：使用远程麦克风的助听器应用中基于头部方向的通道选择方法

标题： Head-steered channel selection method for hearing aid applications using remote microphones

Vasudha Sathyapriyan, Michael S. Pedersen, Mike Brookes, Jan Østergaard, Patrick A. Naylor, Jesper Jensen

评论： 11页，8图

主题：音频与语音处理 (eess.AS)
[49] arXiv:2508.07014 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]: 标题： TurboBias：由GPU加速的短语增强树支持的通用ASR上下文偏差

标题： TurboBias: Universal ASR Context-Biasing powered by GPU-accelerated Phrase-Boosting Tree

Andrei Andrusenko, Vladimir Bataev, Lilit Grigoryan, Vitaly Lavrukhin, Boris Ginsburg

评论：被ASRU 2025接收

主题：音频与语音处理 (eess.AS) ; 人工智能 (cs.AI) ; 计算与语言 (cs.CL) ; 声音 (cs.SD)
[50] arXiv:2508.07219 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]: 标题： ParaNoise-SV：具有语音增强和噪声提取并行联合学习的噪声鲁棒说话人验证综合方法

标题： ParaNoise-SV: Integrated Approach for Noise-Robust Speaker Verification with Parallel Joint Learning of Speech Enhancement and Noise Extraction

Minu Kim, Kangwook Jang, Hoirin Kim

评论： 5页，3图，已被Interspeech 2025接收

主题：音频与语音处理 (eess.AS) ; 声音 (cs.SD)

总共 312 条目 : 1-50 51-100 101-150 151-200 ... 301-312

显示最多 50 每页条目：较少 | 更多 | 所有

音频与语音处理

2025年08月 的作者和标题

2025年08月的作者和标题