Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > cs.PF

帮助 | 高级搜索

性能

2025年08月 的作者和标题

总共 45 条目
显示最多 50 每页条目: 较少 | 更多 | 所有
[1] arXiv:2508.00441 (交叉列表自 cs.PF) [中文pdf, pdf, html, 其他]
标题: DGEMM 不使用 FP64 算法 -- 使用 FP64 模拟和 FP8 张量核心的 Ozaki 方案
标题: DGEMM without FP64 Arithmetic -- Using FP64 Emulation and FP8 Tensor Cores with Ozaki Scheme
Daichi Mukunoki
主题: 性能 (cs.PF) ; 硬件架构 (cs.AR) ; 数学软件 (cs.MS)
[2] arXiv:2508.00904 (交叉列表自 cs.PF) [中文pdf, pdf, html, 其他]
标题: 通过硬件无关的解析建模预测LLM推理性能
标题: Forecasting LLM Inference Performance via Hardware-Agnostic Analytical Modeling
Rajeev Patwari, Ashish Sirasao, Devleena Das
评论: 10页,9图
主题: 性能 (cs.PF) ; 人工智能 (cs.AI) ; 硬件架构 (cs.AR) ; 机器学习 (cs.LG)
[3] arXiv:2508.03147 (交叉列表自 cs.PF) [中文pdf, pdf, 其他]
标题: 一种新型的混合光和STAR IRS系统用于NTN通信
标题: A Novel Hybrid Optical and STAR IRS System for NTN Communications
Shunyuan Shang, Emna Zedini, Abla Kammoun, Mohamed-Slim Alouini
主题: 性能 (cs.PF) ; 信息论 (cs.IT)
[4] arXiv:2508.04917 (交叉列表自 cs.PF) [中文pdf, pdf, html, 其他]
标题: 通过细粒度域分解将稀疏三角求解映射到GPU上
标题: Mapping Sparse Triangular Solves to GPUs via Fine-grained Domain Decomposition
Atharva Gondhalekar, Kjetil Haugen, Thomas Gibson, Wu-chun Feng
评论: 14页,14图
主题: 性能 (cs.PF) ; 数值分析 (math.NA)
[5] arXiv:2508.05621 (交叉列表自 cs.PF) [中文pdf, pdf, html, 其他]
标题: 回到比特:将香农的通信性能框架扩展到计算
标题: Back to Bits: Extending Shannon's communication performance framework to computing
Max Hawkins, Richard Vuduc
评论: 5页,4图
主题: 性能 (cs.PF)
[6] arXiv:2508.08343 (交叉列表自 cs.PF) [中文pdf, pdf, html, 其他]
标题: 通过最优适配器缓存提高GPU效率:多租户LLM服务的分析方法
标题: Maximizing GPU Efficiency via Optimal Adapter Caching: An Analytical Approach for Multi-Tenant LLM Serving
Ferran Agullo, Joan Oliveras, Chen Wang, Alberto Gutierrez-Torre, Olivier Tardieu, Alaa Youssef, Jordi Torres, Josep Ll. Berral
评论: 正在审稿中的计算机科学会议
主题: 性能 (cs.PF) ; 人工智能 (cs.AI) ; 计算与语言 (cs.CL)
[7] arXiv:2508.08531 (交叉列表自 cs.PF) [中文pdf, pdf, 其他]
标题: 在苹果硅芯片上对大型语言模型推理的分析:量化视角
标题: Profiling Large Language Model Inference on Apple Silicon: A Quantization Perspective
Afsara Benazir, Felix Xiaozhu Lin
主题: 性能 (cs.PF)
[8] arXiv:2508.10251 (交叉列表自 cs.PF) [中文pdf, pdf, html, 其他]
标题: 元度量和系统级推理性能基准测试的最佳实践
标题: Meta-Metrics and Best Practices for System-Level Inference Performance Benchmarking
Shweta Salaria, Zhuoran Liu, Nelson Mimura Gonzalez
主题: 性能 (cs.PF)
[9] arXiv:2508.11269 (交叉列表自 cs.PF) [中文pdf, pdf, html, 其他]
标题: 基于新型基准框架和指标的边缘设备上大语言模型推理性能评估
标题: Inference performance evaluation for LLMs on edge devices with a novel benchmarking framework and metric
Hao Chen, Cong Tian, Zixuan He, Bin Yu, Yepang Liu, Jialun Cao
主题: 性能 (cs.PF)
[10] arXiv:2508.13249 (交叉列表自 cs.PF) [中文pdf, pdf, 其他]
标题: 多度量算法复杂性:超越渐近分析
标题: Multi-Metric Algorithmic Complexity: Beyond Asymptotic Analysis
Sergii Kavun
评论: 24页,12图,3表
主题: 性能 (cs.PF) ; 硬件架构 (cs.AR) ; 计算复杂性 (cs.CC) ; 数据结构与算法 (cs.DS)
[11] arXiv:2508.00305 (交叉列表自 cs.CL) [中文pdf, pdf, html, 其他]
标题: 长期上下文语言模型优化技术的系统评估
标题: Systematic Evaluation of Optimization Techniques for Long-Context Language Models
Ammar Ahmed, Sheng Di, Franck Cappello, Zirui Liu, Jingoo Han, Ali Anwar
主题: 计算与语言 (cs.CL) ; 机器学习 (cs.LG) ; 性能 (cs.PF)
[12] arXiv:2508.00629 (交叉列表自 cs.NI) [中文pdf, pdf, html, 其他]
标题: 能源感知的O-RAN CPU协调:一种dApp驱动的轻量级方法
标题: Energy-Aware CPU Orchestration in O-RAN: A dApp-Driven Lightweight Approach
Francisco Crespo, Javier Villegas, Carlos Baena, Eduardo Baena, Sergio Fortes, Raquel Barco
主题: 网络与互联网架构 (cs.NI) ; 操作系统 (cs.OS) ; 性能 (cs.PF)
[13] arXiv:2508.00816 (交叉列表自 math.OC) [中文pdf, pdf, html, 其他]
标题: 大型单输入超状态可分解马尔可夫决策过程的高效求解
标题: Efficient Solving of Large Single Input Superstate Decomposable Markovian Decision Process
Youssef Ait El Mahjoub, Jean-Michel Fourneau, Salma Alouah
评论: 预印本文章提交至ValueTools2025
主题: 优化与控制 (math.OC) ; 机器学习 (cs.LG) ; 性能 (cs.PF)
[14] arXiv:2508.01506 (交叉列表自 cs.LG) [中文pdf, pdf, html, 其他]
标题: FlashSVD:低秩模型流式传输的内存高效推理
标题: FlashSVD: Memory-Efficient Inference with Streaming for Low-Rank Models
Zishan Shao, Yixiao Wang, Qinsi Wang, Ting Jiang, Zhixu Du, Hancheng Ye, Danyang Zhuo, Yiran Chen, Hai Li
评论: 技术报告
主题: 机器学习 (cs.LG) ; 人工智能 (cs.AI) ; 性能 (cs.PF)
[15] arXiv:2508.01635 (交叉列表自 cs.LG) [中文pdf, pdf, html, 其他]
标题: 学习统一系统表示用于微服务尾部延迟预测
标题: Learning Unified System Representations for Microservice Tail Latency Prediction
Wenzhuo Qian, Hailiang Zhao, Tianlv Chen, Jiayi Chen, Ziqi Wang, Kingsum Chow, Shuiguang Deng
主题: 机器学习 (cs.LG) ; 人工智能 (cs.AI) ; 分布式、并行与集群计算 (cs.DC) ; 性能 (cs.PF)
[16] arXiv:2508.01694 (交叉列表自 cs.CR) [中文pdf, pdf, html, 其他]
标题: CRYSTALS Kyber作为RSA和ECC后量子替代方案的性能和存储分析
标题: Performance and Storage Analysis of CRYSTALS Kyber as a Post Quantum Replacement for RSA and ECC
Nicolas Rodriguez-Alvarez (1), Fernando Rodriguez-Merino (2) ((1) IES Parquesol, Valladolid, Spain, (2) Department of Theoretical, Atomic and Optical Physics, University of Valladolid, Valladolid, Spain)
主题: 密码学与安全 (cs.CR) ; 性能 (cs.PF)
[17] arXiv:2508.02729 (交叉列表自 cs.SE) [中文pdf, pdf, 其他]
标题: 使用深度学习解释性能曲线
标题: Interpreting Performance Profiles with Deep Learning
Zhuoran Liu
评论: 计算机科学硕士论文,北卡罗来纳州立大学,2022年。导师:刘旭博士
主题: 软件工程 (cs.SE) ; 人工智能 (cs.AI) ; 性能 (cs.PF)
[18] arXiv:2508.04124 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 基于特权信息的学习用于垃圾检测
标题: Learning Using Privileged Information for Litter Detection
Matthias Bartolo, Konstantinos Makantasis, Dylan Seychell
评论: 这篇论文被接受在第13届欧洲视觉信息处理研讨会(EUVIP 2025)上发表。
主题: 计算机视觉与模式识别 (cs.CV) ; 新兴技术 (cs.ET) ; 机器学习 (cs.LG) ; 性能 (cs.PF)
[19] arXiv:2508.05001 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: CRAM:具有自举压缩的大规模视频持续学习
标题: CRAM: Large-scale Video Continual Learning with Bootstrapped Compression
Shivani Mall, Joao F. Henriques
主题: 计算机视觉与模式识别 (cs.CV) ; 机器学习 (cs.LG) ; 性能 (cs.PF)
[20] arXiv:2508.05208 (交叉列表自 cs.RO) [中文pdf, pdf, 其他]
标题: 与机器人共舞:在表演艺术环境中的儿童与机器人互动的实验研究
标题: Dancing with a Robot: An Experimental Study of Child-Robot Interaction in a Performative Art Setting
Victor Ngo, Rachel, Ramchurn, Roma Patel, Alan Chamberlain, Ayse Kucukyilmaz
评论: 由施普林格出版
期刊参考: 社交机器人学。ICSR + AI 2024。计算机科学讲座笔记,第15563卷
主题: 机器人技术 (cs.RO) ; 性能 (cs.PF)
[21] arXiv:2508.06617 (交叉列表自 cs.LG) [中文pdf, pdf, html, 其他]
标题: 密集和稀疏大语言模型的缩放定律推广
标题: Generalizing Scaling Laws for Dense and Sparse Large Language Models
Md Arafat Hossain, Xingfu Wu, Valerie Taylor, Ali Jannesari
评论: 8页,8图
主题: 机器学习 (cs.LG) ; 人工智能 (cs.AI) ; 性能 (cs.PF)
[22] arXiv:2508.06753 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]
标题: 推动AI-PC上LLM推理的边界
标题: Pushing the Envelope of LLM Inference on AI-PC
Evangelos Georganas, Dhiraj Kalamkar, Alexander Heinecke
主题: 人工智能 (cs.AI) ; 机器学习 (cs.LG) ; 性能 (cs.PF)
[23] arXiv:2508.07084 (交叉列表自 cs.SE) [中文pdf, pdf, html, 其他]
标题: 对开源Java项目中方法级性能演化的实证研究
标题: An Empirical Study on Method-Level Performance Evolution in Open-Source Java Projects
Kaveh Shahedi, Nana Gyambrah, Heng Li, Maxime Lamothe, Foutse Khomh
主题: 软件工程 (cs.SE) ; 性能 (cs.PF)
[24] arXiv:2508.07640 (交叉列表自 cs.DC) [中文pdf, pdf, html, 其他]
标题: 驯服冷启动:使用模型预测控制的主动无服务器调度
标题: Taming Cold Starts: Proactive Serverless Scheduling with Model Predictive Control
Chanh Nguyen, Monowar Bhuyan, Erik Elmroth
评论: 8页,8张图,预印本已被MASCOTS 2025接收
主题: 分布式、并行与集群计算 (cs.DC) ; 性能 (cs.PF)
[25] arXiv:2508.08430 (交叉列表自 cs.DC) [中文pdf, pdf, html, 其他]
标题: 在NVIDIA Jetson上对并发视觉推理工作负载进行分析——扩展版
标题: Profiling Concurrent Vision Inference Workloads on NVIDIA Jetson -- Extended
Abhinaba Chakraborty, Wouter Tavernier, Akis Kourtis, Mario Pickavet, Andreas Oikonomakis, Didier Colle
主题: 分布式、并行与集群计算 (cs.DC) ; 硬件架构 (cs.AR) ; 性能 (cs.PF)
[26] arXiv:2508.08469 (交叉列表自 cs.DB) [中文pdf, pdf, 其他]
标题: 以向量为中心的机器学习系统:跨堆栈方法
标题: Vector-Centric Machine Learning Systems: A Cross-Stack Approach
Wenqi Jiang
评论: 博士论文(苏黎世联邦理工学院)
主题: 数据库 (cs.DB) ; 硬件架构 (cs.AR) ; 分布式、并行与集群计算 (cs.DC) ; 性能 (cs.PF)
[27] arXiv:2508.08503 (交叉列表自 cs.AR) [中文pdf, pdf, html, 其他]
标题: JSPIM:一种针对高性能数据库连接和选择操作的偏斜感知PIM加速器
标题: JSPIM: A Skew-Aware PIM Accelerator for High-Performance Databases Join and Select Operations
Sabiha Tajdari, Anastasia Ailamaki, Sandhya Dwarkadas
主题: 硬件架构 (cs.AR) ; 数据库 (cs.DB) ; 性能 (cs.PF)
[28] arXiv:2508.08822 (交叉列表自 cs.AR) [中文pdf, pdf, html, 其他]
标题: OISMA:针对矩阵乘法工作负载的在线内存随机乘法架构
标题: OISMA: On-the-fly In-memory Stochastic Multiplication Architecture for Matrix-Multiplication Workloads
Shady Agwa, Yihan Pan, Georgios Papandroulidakis, Themis Prodromakis
评论: 12页,13图。这项工作已提交给IEEE以可能发表
主题: 硬件架构 (cs.AR) ; 人工智能 (cs.AI) ; 新兴技术 (cs.ET) ; 性能 (cs.PF)
[29] arXiv:2508.08906 (交叉列表自 cs.NI) [中文pdf, pdf, html, 其他]
标题: 超以太网的设计原则和架构创新
标题: Ultra Ethernet's Design Principles and Architectural Innovations
Torsten Hoefler, Karen Schramm, Eric Spada, Keith Underwood, Cedell Alexander, Bob Alverson, Paul Bottorff, Adrian Caulfield, Mark Handley, Cathy Huang, Costin Raiciu, Abdul Kabbani, Eugene Opsasnick, Rong Pan, Adee Ran, Rip Sohan
主题: 网络与互联网架构 (cs.NI) ; 硬件架构 (cs.AR) ; 分布式、并行与集群计算 (cs.DC) ; 操作系统 (cs.OS) ; 性能 (cs.PF)
[30] arXiv:2508.09351 (交叉列表自 cs.OS) [中文pdf, pdf, 其他]
标题: 一种对内存侧分层遥测的极限研究
标题: A Limits Study of Memory-side Tiering Telemetry
Vinicius Petrucci, Felippe Zacarias, David Roberts
主题: 操作系统 (cs.OS) ; 硬件架构 (cs.AR) ; 性能 (cs.PF)
[31] arXiv:2508.09573 (交叉列表自 cs.NI) [中文pdf, pdf, 其他]
标题: 基于流的网络变化评估指标
标题: Metrics for Assessing Changes in Flow-based Networks
Michał Rzepka, Piotr Chołda
主题: 网络与互联网架构 (cs.NI) ; 性能 (cs.PF)
[32] arXiv:2508.10202 (交叉列表自 cs.DC) [中文pdf, pdf, html, 其他]
标题: 基于FFT的块三角托普利茨矩阵GPU加速算法的混合精度性能可移植性
标题: Mixed-Precision Performance Portability of FFT-Based GPU-Accelerated Algorithms for Block-Triangular Toeplitz Matrices
Sreeram Venkat, Kasia Swirydowicz, Noah Wolfe, Omar Ghattas
主题: 分布式、并行与集群计算 (cs.DC) ; 性能 (cs.PF) ; 数值分析 (math.NA)
[33] arXiv:2508.11467 (交叉列表自 cs.DC) [中文pdf, pdf, html, 其他]
标题: 基于分治法的高效GPU中心奇异值分解
标题: Efficient GPU-Centered Singular Value Decomposition Using the Divide-and-Conquer Method
Shifang Liu, Huiyuan Li, Hongjiao Sheng, Haoyuan Gui, Xiaoyu Zhang
主题: 分布式、并行与集群计算 (cs.DC) ; 性能 (cs.PF)
[34] arXiv:2508.11824 (交叉列表自 cs.SE) [中文pdf, pdf, html, 其他]
标题: 重新思考自主性:防止人工智能驱动的软件工程中的故障
标题: Rethinking Autonomy: Preventing Failures in AI-Driven Software Engineering
Satyam Kumar Navneet, Joydeep Chandra
主题: 软件工程 (cs.SE) ; 人工智能 (cs.AI) ; 密码学与安全 (cs.CR) ; 性能 (cs.PF)
[35] arXiv:2508.12743 (交叉列表自 cs.DC) [中文pdf, pdf, html, 其他]
标题: 剖析AMD MI300A APU上的CPU-GPU统一物理内存
标题: Dissecting CPU-GPU Unified Physical Memory on AMD MI300A APUs
Jacob Wahlgren, Gabin Schieffer, Ruimin Shi, Edgar A. León, Roger Pearce, Maya Gokhale, Ivy Peng
评论: 将发表于IISWC 2025
主题: 分布式、并行与集群计算 (cs.DC) ; 性能 (cs.PF)
[36] arXiv:2508.13057 (交叉列表自 cs.LG) [中文pdf, pdf, 其他]
标题: 分层评估函数(HEF):一种多指标方法,用于优化需求预测模型
标题: Hierarchical Evaluation Function (HEF): A Multi-Metric Approach for Optimizing Demand Forecasting Models
Adolfo González, Víctor Parada
评论: 31页,15图,110表。作为预印本提交。该文稿介绍了分层评估函数(HEF),这是一种多指标框架,用于在高不确定性下优化需求预测模型。包括使用真实世界数据集的广泛实验验证以及与经典和现代方法的比较分析。
主题: 机器学习 (cs.LG) ; 人工智能 (cs.AI) ; 性能 (cs.PF)
[37] arXiv:2508.13159 (交叉列表自 cs.AR) [中文pdf, pdf, html, 其他]
标题: 通过RC长链结构等价性加速集成电路的晶体管级仿真
标题: Accelerating Transistor-Level Simulation of Integrated Circuits via Equivalence of RC Long-Chain Structures
Ruibai Tang, Wenlai Zhao
主题: 硬件架构 (cs.AR) ; 性能 (cs.PF)
[38] arXiv:2508.13231 (交叉列表自 cs.AR) [中文pdf, pdf, html, 其他]
标题: 通过异构内存系统中的动态KV缓存放置加速LLM推理
标题: Accelerating LLM Inference via Dynamic KV Cache Placement in Heterogeneous Memory System
Yunhua Fang, Rui Xie, Asad Ul Haq, Linsen Ma, Kaoutar El Maghraoui, Naigang Wang, Meng Wang, Liu Liu, Tong Zhang
主题: 硬件架构 (cs.AR) ; 人工智能 (cs.AI) ; 性能 (cs.PF)
[39] arXiv:2508.13298 (交叉列表自 cs.DC) [中文pdf, pdf, html, 其他]
标题: 通过可扩展且分布式的集成错误校正内存内计算充分利用RRAM的潜力
标题: Harnessing the Full Potential of RRAMs through Scalable and Distributed In-Memory Computing with Integrated Error Correction
Huynh Q. N. Vo, Md Tawsif Rahman Chowdhury, Paritosh Ramanan, Murat Yildirim, Gozde Tutuncuoglu
评论: 提交至《自然通讯》 联系作者获取更多信息
主题: 分布式、并行与集群计算 (cs.DC) ; 硬件架构 (cs.AR) ; 新兴技术 (cs.ET) ; 性能 (cs.PF) ; 系统与控制 (eess.SY)
[40] arXiv:2508.13523 (交叉列表自 cs.DC) [中文pdf, pdf, html, 其他]
标题: LAMMPS-KOKKOS:在Exascale架构上性能可移植的分子动力学
标题: LAMMPS-KOKKOS: Performance Portable Molecular Dynamics Across Exascale Architectures
Anders Johansson, Evan Weinberg, Christian R. Trott, Megan J. McCarthy, Stan G. Moore
评论: 14页,6图
主题: 分布式、并行与集群计算 (cs.DC) ; 性能 (cs.PF) ; 计算物理 (physics.comp-ph)
[41] arXiv:2508.14117 (交叉列表自 astro-ph.IM) [中文pdf, pdf, html, 其他]
标题: SYCL用于高效能数值天体物理学:DPEcho的情况
标题: SYCL for Energy-Efficient Numerical Astrophysics: the case of DPEcho
Salvatore Cielo, Alexander Pöppl, Ivan Pribec
评论: 11页,6图,2表
期刊参考: PECS研讨会论文集在2025年欧洲平行计算大会
主题: 天体物理学的仪器与方法 (astro-ph.IM) ; 性能 (cs.PF)
[42] arXiv:2508.14209 (交叉列表自 math.NA) [中文pdf, pdf, html, 其他]
标题: 一种高性能GPU CountSketch实现及其在Multisketching和最小二乘问题中的应用
标题: A High Performance GPU CountSketch Implementation and Its Application to Multisketching and Least Squares Problems
Andrew J. Higgins, Erik G. Boman, Ichitaro Yamazaki
评论: 8页
主题: 数值分析 (math.NA) ; 分布式、并行与集群计算 (cs.DC) ; 性能 (cs.PF)
[43] arXiv:2508.15357 (交叉列表自 cs.CL) [中文pdf, pdf, html, 其他]
标题: KG-EDAS:一种用于评估知识图谱补全模型的元度量框架
标题: KG-EDAS: A Meta-Metric Framework for Evaluating Knowledge Graph Completion Models
Haji Gul, Abul Ghani Naim, Ajaz Ahmad Bhat
主题: 计算与语言 (cs.CL) ; 性能 (cs.PF)
[44] arXiv:2508.15478 (交叉列表自 cs.CL) [中文pdf, pdf, html, 其他]
标题: SLM-Bench:小语言模型环境影响的全面基准——扩展版
标题: SLM-Bench: A Comprehensive Benchmark of Small Language Models on Environmental Impacts -- Extended Version
Nghiem Thanh Pham, Tung Kieu, Duc-Manh Nguyen, Son Ha Xuan, Nghia Duong-Trung, Danh Le-Phuoc
评论: 24页。《SLM-Bench:小型语言模型环境影响的全面基准》的扩展版被EMNLP 2025接收
主题: 计算与语言 (cs.CL) ; 计算机与社会 (cs.CY) ; 性能 (cs.PF)
[45] arXiv:2508.15601 (交叉列表自 cs.DC) [中文pdf, pdf, html, 其他]
标题: 使用TurboMind进行高效的混合精度大语言模型推理
标题: Efficient Mixed-Precision Large Language Model Inference with TurboMind
Li Zhang, Youhe Jiang, Guoliang He, Xin Chen, Han Lv, Qian Yao, Fangcheng Fu, Kai Chen
主题: 分布式、并行与集群计算 (cs.DC) ; 性能 (cs.PF)
总共 45 条目
显示最多 50 每页条目: 较少 | 更多 | 所有
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号