Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > eess.AS

帮助 | 高级搜索

音频与语音处理

2025年10月 的作者和标题

总共 241 条目 : 1-50 51-100 101-150 151-200 ... 201-241
显示最多 50 每页条目: 较少 | 更多 | 所有
[1] arXiv:2510.00180 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]
标题: DiffAU:基于扩散的全向音场提升
标题: DiffAU: Diffusion-Based Ambisonics Upscaling
Amit Milstein, Nir Shlezinger, Boaz Rafaely
主题: 音频与语音处理 (eess.AS) ; 声音 (cs.SD) ; 信号处理 (eess.SP)
[2] arXiv:2510.00218 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]
标题: 描述符:用于合成语音检测和说话人识别的扩展长度音频数据集(ELAD-SVDSR)
标题: Descriptor:: Extended-Length Audio Dataset for Synthetic Voice Detection and Speaker Recognition (ELAD-SVDSR)
Rahul Vijaykumar, Ajan Ahmed, John Parker, Dinesh Pendyala, Aidan Collins, Stephanie Schuckers, Masudul H. Imtiaz
主题: 音频与语音处理 (eess.AS) ; 声音 (cs.SD)
[3] arXiv:2510.00238 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]
标题: 通过可微分反馈延迟网络进行房间脉冲响应合成以实现高效的三维音频渲染
标题: Room Impulse Response Synthesis via Differentiable Feedback Delay Networks for Efficient Spatial Audio Rendering
Armin Gerami, Ramani Duraiswami
主题: 音频与语音处理 (eess.AS) ; 声音 (cs.SD)
[4] arXiv:2510.00256 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]
标题: 个性化自语音重建系统的主观质量评估
标题: Subjective quality evaluation of personalized own voice reconstruction systems
Mattes Ohlenbusch, Christian Rollwage, Simon Doclo, Jan Rennies
评论: 提交至《声学学报》
主题: 音频与语音处理 (eess.AS) ; 声音 (cs.SD)
[5] arXiv:2510.00313 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]
标题: 音频扩散变换器的训练后量化
标题: Post-Training Quantization for Audio Diffusion Transformers
Tanmay Khandelwal, Magdalena Fuentes
评论: 5页,4图,已被IEEE语音和声学信号处理应用研讨会(WASPAA)2025接受
主题: 音频与语音处理 (eess.AS) ; 声音 (cs.SD)
[6] arXiv:2510.00346 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]
标题: 基于对比学习和分布对齐的蚊种分类领域鲁棒生物声学表征学习
标题: Learning Domain-Robust Bioacoustic Representations for Mosquito Species Classification with Contrastive Learning and Distribution Alignment
Yuanbo Hou, Zhaoyi Liu, Xin Shen, Stephen Roberts
主题: 音频与语音处理 (eess.AS) ; 声音 (cs.SD)
[7] arXiv:2510.00771 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]
标题: UniverSR:通过无声码器流匹配的统一且多功能的音频超分辨率
标题: UniverSR: Unified and Versatile Audio Super-Resolution via Vocoder-Free Flow Matching
Woongjib Choi, Sangmin Lee, Hyungseob Lim, Hong-Goo Kang
评论: 提交至ICASSP 2026
主题: 音频与语音处理 (eess.AS) ; 人工智能 (cs.AI) ; 声音 (cs.SD) ; 信号处理 (eess.SP)
[8] arXiv:2510.00914 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]
标题: 通过使用实时MRI数据通过声学到发音的反演重建完整的声道轮廓
标题: Reconstruction of the Complete Vocal Tract Contour Through Acoustic to Articulatory Inversion Using Real-Time MRI Data
Sofiane Azzouz, Pierre-André Vuissoz, Yves Laprie
主题: 音频与语音处理 (eess.AS)
[9] arXiv:2510.00952 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]
标题: CL-UZH 提交到 NIST SRE 2024 说话人识别评估
标题: CL-UZH submission to the NIST SRE 2024 Speaker Recognition Evaluation
Aref Farhadipour, Shiran Liu, Masoumeh Chapariniya, Valeriia Vyshnevetska, Srikanth Madikeri, Teodora Vukovic, Volker Dellwo
评论: CL-UZH 提交的 NIST SRE 2024 评估计划
主题: 音频与语音处理 (eess.AS) ; 声音 (cs.SD)
[10] arXiv:2510.00982 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]
标题: 螺旋转换器:具有循环层跳过和早期退出的流式语音识别低延迟编码器
标题: Spiralformer: Low Latency Encoder for Streaming Speech Recognition with Circular Layer Skipping and Early Exiting
Emiru Tsunoo, Hayato Futami, Yosuke Kashiwagi, Siddhant Arora, Shinji Watanabe
评论: 被ASRU 2025接受
主题: 音频与语音处理 (eess.AS) ; 计算与语言 (cs.CL) ; 声音 (cs.SD)
[11] arXiv:2510.01130 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]
标题: 学习单通道语音增强的时间图频率表示
标题: Learning Time-Graph Frequency Representation for Monaural Speech Enhancement
Tingting Wang, Tianrui Wang, Meng Ge, Qiquan Zhang, Xi Shao
评论: 被IEEE TASLP接受
主题: 音频与语音处理 (eess.AS)
[12] arXiv:2510.01818 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]
标题: 说话人和欺骗检测器的联合优化用于抗欺骗自动说话人验证
标题: Joint Optimization of Speaker and Spoof Detectors for Spoofing-Robust Automatic Speaker Verification
Oğuzhan Kurnaz, Jagabandhu Mishra, Tomi H. Kinnunen, Cemal Hanilçi
主题: 音频与语音处理 (eess.AS)
[13] arXiv:2510.01860 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]
标题: SLAP:从自然语言监督中学习说话人和健康相关表示
标题: SLAP: Learning Speaker and Health-Related Representations from Natural Language Supervision
Angelika Ando, Auguste Crabeil, Adrien Lesage, Rachid Riad
主题: 音频与语音处理 (eess.AS) ; 声音 (cs.SD)
[14] arXiv:2510.01940 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]
标题: 基于变分自编码器的助听设备声学环境聚类
标题: Clustering of Acoustic Environments with Variational Autoencoders for Hearing Devices
Luan Vinícius Fiorio, Ivana Nikoloska, Wim van Houtum, Ronald M. Aarts
评论: 此作品已提交给IEEE以供可能发表
主题: 音频与语音处理 (eess.AS)
[15] arXiv:2510.02320 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]
标题: WEE-疗法:一种弱编码器混合框架用于心理辅导对话分析
标题: WEE-Therapy: A Mixture of Weak Encoders Framework for Psychological Counseling Dialogue Analysis
Yongqi Kang, Yong Zhao
评论: 5页
主题: 音频与语音处理 (eess.AS) ; 计算与语言 (cs.CL) ; 机器学习 (cs.LG) ; 声音 (cs.SD)
[16] arXiv:2510.02322 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]
标题: SpeechCT-CLIP:将文本图像知识蒸馏到语音中用于语音原生的多模态CT分析
标题: SpeechCT-CLIP: Distilling Text-Image Knowledge to Speech for Voice-Native Multimodal CT Analysis
Lukas Buess, Jan Geier, David Bani-Harouni, Chantal Pellegrini, Matthias Keicher, Paula Andrea Perez-Toro, Nassir Navab, Andreas Maier, Tomas Arias-Vergara
评论: 提交至ICASSP 2026;正在审稿中
主题: 音频与语音处理 (eess.AS) ; 计算与语言 (cs.CL)
[17] arXiv:2510.02398 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]
标题: 当语音重要时:语音LLMs位置偏见中的性别差异证据
标题: When Voice Matters: Evidence of Gender Disparity in Positional Bias of SpeechLLMs
Shree Harsha Bokkahalli Satish, Gustav Eje Henter, Éva Székely
评论: 16页,5图,将发表于SPECOM 2025
主题: 音频与语音处理 (eess.AS) ; 声音 (cs.SD)
[18] arXiv:2510.02556 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]
标题: 基于欧几里得距离矩阵的多源定位与到达方向估计
标题: Multi-Source Position and Direction-of-Arrival Estimation Based on Euclidean Distance Matrices
Klaus Brümann, Simon Doclo
评论: 13页,6图,提交至IEEE语音、音频和语言处理汇刊(等待审稿)
主题: 音频与语音处理 (eess.AS) ; 信号处理 (eess.SP)
[19] arXiv:2510.02672 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]
标题: STSM-FiLM:一种FiLM条件神经架构用于语音的时域尺度修改
标题: STSM-FiLM: A FiLM-Conditioned Neural Architecture for Time-Scale Modification of Speech
Dyah A. M. G. Wisnu, Ryandhimas E. Zezario, Stefano Rini, Fo-Rui Li, Yan-Tsung Peng, Hsin-Min Wang, Yu Tsao
主题: 音频与语音处理 (eess.AS) ; 声音 (cs.SD)
[20] arXiv:2510.02797 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]
标题: SongFormer:利用异构监督进行音乐结构分析的扩展
标题: SongFormer: Scaling Music Structure Analysis with Heterogeneous Supervision
Chunbo Hao, Ruibin Yuan, Jixun Yao, Qixin Deng, Xinyi Bai, Wei Xue, Lei Xie
主题: 音频与语音处理 (eess.AS)
[21] arXiv:2510.02813 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]
标题: 通过图神经网络增强用于HRTF合成的摄影测量重建
标题: Enhancing Photogrammetry Reconstruction For HRTF Synthesis Via A Graph Neural Network
Ludovic Pirard, Katarina C. Poole, Lorenzo Picinali
评论: 被接受为论坛声学欧罗诺伊斯2025的海报展示,西班牙马拉加
主题: 音频与语音处理 (eess.AS)
[22] arXiv:2510.03025 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]
标题: CVSM:对比语音相似性建模
标题: CVSM: Contrastive Vocal Similarity Modeling
Christos Garoufis, Athanasia Zlatintsi, Petros Maragos
评论: 13页,3张表格,8张图表。提交至IEEE语音、音频和语言处理汇刊(预印本版本)
主题: 音频与语音处理 (eess.AS) ; 声音 (cs.SD)
[23] arXiv:2510.03111 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]
标题: 预处理管道在创建野生文本到语音数据集中的评估
标题: Evaluation of preprocessing pipelines in the creation of in-the-wild TTS datasets
Matías Di Bernardo, Emmanuel Misley, Ignacio Correa, Mateo García Iacovelli, Simón Mellino, Gala Lucía Gonzalez Barrios
评论: 5页,4图,提交至ICASSP 2026
主题: 音频与语音处理 (eess.AS)
[24] arXiv:2510.03630 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]
标题: 基于说话人无关活动流的多说话人ASR扩展
标题: Scaling Multi-Talker ASR with Speaker-Agnostic Activity Streams
Xiluo He, Alexander Polok, Jesús Villalba, Thomas Thebaud, Matthew Maciejewski
主题: 音频与语音处理 (eess.AS) ; 声音 (cs.SD)
[25] arXiv:2510.03723 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]
标题: 适应说话人分割条件的Whisper用于端到端多说话人语音识别
标题: Adapting Diarization-Conditioned Whisper for End-to-End Multi-Talker Speech Recognition
Martin Kocour, Martin Karafiat, Alexander Polok, Dominik Klement, Lukáš Burget, Jan Černocký
主题: 音频与语音处理 (eess.AS) ; 计算与语言 (cs.CL) ; 声音 (cs.SD)
[26] arXiv:2510.03825 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]
标题: 用于语音传输指数(STI)计算的MATLAB工具箱
标题: A MATLAB toolbox for Computation of Speech Transmission Index (STI)
Pavel Rajmic, Jiří Schimmel, Šimon Cieslar
主题: 音频与语音处理 (eess.AS) ; 声音 (cs.SD)
[27] arXiv:2510.03986 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]
标题: 一种多语言框架用于构音障碍:检测、严重程度分类、语音到文本和清晰语音生成
标题: A Multilingual Framework for Dysarthria: Detection, Severity Classification, Speech-to-Text, and Clean Speech Generation
Ananya Raghu, Anisha Raghu, Nithika Vivek, Sofie Budman, Omar Mansour
主题: 音频与语音处理 (eess.AS) ; 声音 (cs.SD)
[28] arXiv:2510.04136 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]
标题: MoME:用于音视频语音识别的套娃专家混合模型
标题: MoME: Mixture of Matryoshka Experts for Audio-Visual Speech Recognition
Umberto Cappellazzo, Minsu Kim, Pingchuan Ma, Honglie Chen, Xubo Liu, Stavros Petridis, Maja Pantic
评论: 神经信息处理系统大会 2025
主题: 音频与语音处理 (eess.AS) ; 计算机视觉与模式识别 (cs.CV) ; 声音 (cs.SD)
[29] arXiv:2510.04162 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]
标题: Drax:具有离散流匹配的语音识别
标题: Drax: Speech Recognition with Discrete Flow Matching
Aviv Navon, Aviv Shamsian, Neta Glazer, Yael Segal-Feldman, Gill Hetz, Joseph Keshet, Ethan Fetaya
主题: 音频与语音处理 (eess.AS) ; 机器学习 (cs.LG) ; 声音 (cs.SD)
[30] arXiv:2510.04213 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]
标题: 使用w2v-BERT 2.0和知识蒸馏引导的结构化剪枝增强说话人验证
标题: Enhancing Speaker Verification with w2v-BERT 2.0 and Knowledge Distillation guided Structured Pruning
Ze Li, Ming Cheng, Ming Li
主题: 音频与语音处理 (eess.AS) ; 声音 (cs.SD)
[31] arXiv:2510.04219 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]
标题: 检测和评估中对构音障碍语音的Whisper探测
标题: Probing Whisper for Dysarthric Speech in Detection and Assessment
Zhengjun Yue, Devendra Kayande, Zoran Cvetkovic, Erfan Loweimi
评论: 提交至ICASSP 2026
主题: 音频与语音处理 (eess.AS) ; 声音 (cs.SD)
[32] arXiv:2510.04459 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]
标题: 可微分物理用于声场重建
标题: Differentiable physics for sound field reconstruction
Samuel A. Verburg, Efren Fernandez-Grande, Peter Gerstoft
评论: 28页加参考文献,8幅图,完整的期刊论文
主题: 音频与语音处理 (eess.AS) ; 声音 (cs.SD)
[33] arXiv:2510.04593 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]
标题: UniVoice:使用大型语言模型统一自回归自动语音识别和基于流匹配的文本到语音合成
标题: UniVoice: Unifying Autoregressive ASR and Flow-Matching based TTS with Large Language Models
Wenhao Guan, Zhikang Niu, Ziyue Jiang, Kaidi Wang, Peijie Chen, Qingyang Hong, Lin Li, Xie Chen
主题: 音频与语音处理 (eess.AS) ; 声音 (cs.SD)
[34] arXiv:2510.04934 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]
标题: AURA评分:一种全面音频问答评估的度量标准
标题: AURA Score: A Metric For Holistic Audio Question Answering Evaluation
Satvik Dixit, Soham Deshmukh, Bhiksha Raj
主题: 音频与语音处理 (eess.AS) ; 人工智能 (cs.AI)
[35] arXiv:2510.04937 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]
标题: 从单声道源外推的时空房间脉冲响应的感知评估
标题: Perceptual Evaluation of Extrapolated Spatial Room Impulse Responses From a Mono Source
Ben Heritage, Fiona Ryder, Michael McLoughlin, Karolina Prawda
评论: 将作为海报在ADC 2025上展示的预印本
主题: 音频与语音处理 (eess.AS)
[36] arXiv:2510.04956 (交叉列表自 eess.AS) [中文pdf, pdf, 其他]
标题: MuFFIN:具有交互式分层神经建模的多方面发音反馈模型
标题: MuFFIN: Multifaceted Pronunciation Feedback Model with Interactive Hierarchical Neural Modeling
Bi-Cheng Yan, Ming-Kang Tsai, Berlin Chen
评论: 已被接受并将在IEEE/ACM语音、音频和语言处理汇刊上发表
主题: 音频与语音处理 (eess.AS) ; 人工智能 (cs.AI)
[37] arXiv:2510.05305 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]
标题: WaveSP-Net:语音深度伪造检测中的可学习小波域稀疏提示调优
标题: WaveSP-Net: Learnable Wavelet-Domain Sparse Prompt Tuning for Speech Deepfake Detection
Xi Xuan, Xuechen Liu, Wenxin Zhang, Yi-Cheng Lin, Xiaojian Lin, Tomi Kinnunen
评论: 提交至ICASSP 2026
主题: 音频与语音处理 (eess.AS) ; 计算与语言 (cs.CL) ; 信号处理 (eess.SP)
[38] arXiv:2510.05478 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]
标题: AQA-TTRL:测试时强化学习中的音频问答自适应
标题: AQA-TTRL: Self-Adaptation in Audio Question Answering with Test-Time Reinforcement Learning
Haoyu Zhang, Jiaxian Guo, Yusuke Iwasawa, Yutaka Matsuo
评论: 5页,4图,提交至ICASSP 2026
主题: 音频与语音处理 (eess.AS)
[39] arXiv:2510.05619 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]
标题: 教机器用发音控制说话
标题: Teaching Machines to Speak Using Articulatory Control
Akshay Anand, Chenxu Guo, Cheol Jun Cho, Jiachen Lian, Gopala Anumanchipalli
主题: 音频与语音处理 (eess.AS)
[40] arXiv:2510.05718 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]
标题: 说话人嵌入中感知不一致性的研究用于异步语音匿名化
标题: Investigation of perception inconsistency in speaker embedding for asynchronous voice anonymization
Rui Wang, Liping Chen, Kong Aik Lee, Zhengpeng Zha, Zhenhua Ling
主题: 音频与语音处理 (eess.AS)
[41] arXiv:2510.05757 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]
标题: 神经前向滤波用于说话人图像分离
标题: Neural Forward Filtering for Speaker-Image Separation
Jingqi Sun, Shulin He, Ruizhe Pang, Zhong-Qiu Wang
评论: 在提交中
主题: 音频与语音处理 (eess.AS)
[42] arXiv:2510.05922 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]
标题: 重新审视MFCC:谱-韵律耦合的证据
标题: Revisiting MFCCs: Evidence for Spectral-Prosodic Coupling
Vitor Magno de O. S. Bezerra, Gabriel F. A. Bastos, Jugurta Montalvão
评论: 5页,3图,ISCMI 2025
主题: 音频与语音处理 (eess.AS)
[43] arXiv:2510.05934 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]
标题: 重新审视语音情感识别中的建模与评估方法:考虑标注者的主观性和情感的模糊性
标题: Revisiting Modeling and Evaluation Approaches in Speech Emotion Recognition: Considering Subjectivity of Annotators and Ambiguity of Emotions
Huang-Cheng Chou, Chi-Chun Lee
评论: 博士论文;ACLCLP博士论文奖——荣誉提名
主题: 音频与语音处理 (eess.AS)
[44] arXiv:2510.06201 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]
标题: TokenChain:通过语义标记建模的离散语音链
标题: TokenChain: A Discrete Speech Chain via Semantic Token Modeling
Mingxuan Wang, Satoshi Nakamura
评论: 5页,3图。提交至IEEE国际声学、语音与信号处理会议(ICASSP)2026
主题: 音频与语音处理 (eess.AS) ; 人工智能 (cs.AI) ; 计算与语言 (cs.CL) ; 声音 (cs.SD)
[45] arXiv:2510.06785 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]
标题: 莫伊塞斯-光:用于音乐源分离的高效带分割U-Net
标题: Moises-Light: Resource-efficient Band-split U-Net For Music Source Separation
Yun-Ning (Amy)Hung, Igor Pereira, Filip Korzeniowski
主题: 音频与语音处理 (eess.AS) ; 声音 (cs.SD)
[46] arXiv:2510.06927 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]
标题: 面向负责任的文本到语音评估
标题: Towards Responsible Evaluation for Text-to-Speech
Yifan Yang, Hui Wang, Bing Han, Shujie Liu, Jinyu Li, Yong Qin, Xie Chen
主题: 音频与语音处理 (eess.AS)
[47] arXiv:2510.07299 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]
标题: 人类专家与机器检测帕金森病的语音任务比较
标题: Comparison of Speech Tasks in Human Expert and Machine Detection of Parkinson's Disease
Peter Plantinga, Roozbeh Sattari, Karine Marcotte, Carla Di Gironimo, Madeleine Sharp, Liziane Bouvier, Maiya Geddes, Ingrid Verduyckt, Étienne de Villers-Sidani, Mirco Ravanelli, Denise Klein
评论: 被接受到SMASH 2025
主题: 音频与语音处理 (eess.AS) ; 声音 (cs.SD)
[48] arXiv:2510.07592 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]
标题: SALAD-VAE:语义音频压缩与语言-音频蒸馏
标题: SALAD-VAE: Semantic Audio Compression with Language-Audio Distillation
Sebastian Braun, Hannes Gamper, Dimitra Emmanouilidou
评论: 提交至ICASSP 2026
主题: 音频与语音处理 (eess.AS)
[49] arXiv:2510.07838 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]
标题: 全双工基准v2:一种具有自动考官的双工对话系统的多轮评估框架
标题: Full-Duplex-Bench-v2: A Multi-Turn Evaluation Framework for Duplex Dialogue Systems with an Automated Examiner
Guan-Ting Lin, Shih-Yun Shan Kuan, Jiatong Shi, Kai-Wei Chang, Siddhant Arora, Shinji Watanabe, Hung-yi Lee
评论: 进行中
主题: 音频与语音处理 (eess.AS)
[50] arXiv:2510.07908 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]
标题: 基于扩散模型的吉他音色变形
标题: Guitar Tone Morphing by Diffusion-based Model
Kuan-Yu Chen, Kuan-Lin Chen, Yu-Chieh Yu, Jian-Jiun Ding
评论: 5页,被APSIPA ASC 2025接收
主题: 音频与语音处理 (eess.AS)
总共 241 条目 : 1-50 51-100 101-150 151-200 ... 201-241
显示最多 50 每页条目: 较少 | 更多 | 所有
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号