计算机视觉与模式识别

2025年06月的作者和标题

总共 3129 条目 : 1-25 ... 2951-2975 2976-3000 3001-3025 3026-3050 3051-3075 3076-3100 3101-3125 ... 3126-3129

显示最多 25 每页条目：较少 | 更多 | 所有

[3026] arXiv:2506.20990 (交叉列表自 cs.LG) [中文pdf, pdf, html, 其他]: 标题： SharpZO：通过仅前向传递的混合锐度感知视觉语言模型提示微调

标题： SharpZO: Hybrid Sharpness-Aware Vision Language Model Prompt Tuning via Forward-Only Passes

Yifan Yang, Zhen Zhang, Rupak Vignesh Swaminathan, Jing Liu, Nathan Susanj, Zheng Zhang

主题：机器学习 (cs.LG) ; 计算与语言 (cs.CL) ; 计算机视觉与模式识别 (cs.CV)
[3027] arXiv:2506.21037 (交叉列表自 cs.LG) [中文pdf, pdf, html, 其他]: 标题： RL-Selector：通过冗余评估的强化学习引导数据选择

标题： RL-Selector: Reinforcement Learning-Guided Data Selection via Redundancy Assessment

Suorong Yang, Peijia Li, Furao Shen, Jian Zhao

评论： ICCV 2025

期刊参考： ICCV 2025

主题：机器学习 (cs.LG) ; 计算机视觉与模式识别 (cs.CV)
[3028] arXiv:2506.21041 (交叉列表自 cs.RO) [中文pdf, pdf, html, 其他]: 标题： SEAL：基于视觉-语言模型的安全端到端协同自动驾驶自适应长尾建模

标题： SEAL: Vision-Language Model-Based Safe End-to-End Cooperative Autonomous Driving with Adaptive Long-Tail Modeling

Junwei You, Pei Li, Zhuoyu Jiang, Zilin Huang, Rui Gan, Haotian Shi, Bin Ran

主题：机器人技术 (cs.RO) ; 人工智能 (cs.AI) ; 计算机视觉与模式识别 (cs.CV)
[3029] arXiv:2506.21144 (交叉列表自 cs.LG) [中文pdf, pdf, html, 其他]: 标题：通过双提示优化和跨融合的个性化联邦学习

标题： Personalized Federated Learning via Dual-Prompt Optimization and Cross Fusion

Yuguang Zhang, Kuangpu Guo, Zhihe Lu, Yunbo Wang, Jian Liang

主题：机器学习 (cs.LG) ; 计算机视觉与模式识别 (cs.CV)
[3030] arXiv:2506.21171 (交叉列表自 eess.IV) [中文pdf, pdf, 其他]: 标题：在DCT中发现宝藏：通过利用潜在相关性提升JPEG质量

标题： Uncover Treasures in DCT: Advancing JPEG Quality Enhancement by Exploiting Latent Correlations

Jing Yang, Qunliang Xing, Mai Xu, Minglang Qiao

主题：图像与视频处理 (eess.IV) ; 计算机视觉与模式识别 (cs.CV)
[3031] arXiv:2506.21245 (交叉列表自 eess.IV) [中文pdf, pdf, html, 其他]: 标题： GANet-Seg：基于混合生成模型的对抗学习在脑肿瘤分割中的应用

标题： GANet-Seg: Adversarial Learning for Brain Tumor Segmentation with Hybrid Generative Models

Qifei Cui, Xinyu Lu

主题：图像与视频处理 (eess.IV) ; 计算机视觉与模式识别 (cs.CV)
[3032] arXiv:2506.21272 (交叉列表自 cs.GR) [中文pdf, pdf, html, 其他]: 标题： FairyGen：从单个儿童绘制的角色生成故事漫画视频

标题： FairyGen: Storied Cartoon Video from a Single Child-Drawn Character

Jiayi Zheng, Xiaodong Cun

评论：项目页面：https://jayleejia.github.io/FairyGen/ ; 代码：https://github.com/GVCLab/FairyGen

主题：图形学 (cs.GR) ; 计算机视觉与模式识别 (cs.CV) ; 多媒体 (cs.MM)
[3033] arXiv:2506.21319 (交叉列表自 cs.HC) [中文pdf, pdf, html, 其他]: 标题： SimVecVis：用于增强可视化理解的多模态大语言模型数据集

标题： SimVecVis: A Dataset for Enhancing MLLMs in Visualization Understanding

Can Liu, Chunlin Da, Xiaoxiao Long, Yuxiao Yang, Yu Zhang, Yong Wang

主题：人机交互 (cs.HC) ; 计算机视觉与模式识别 (cs.CV)
[3034] arXiv:2506.21331 (交叉列表自 cs.DL) [中文pdf, pdf, html, 其他]: 标题：基于联盟参考文献和出版物权重的论文自动审稿人分配

标题： Automatic Reviewers Assignment to a Research Paper Based on Allied References and Publications Weight

Tamim Al Mahmud, B M Mainul Hossain, Dilshad Ara

评论： IEEE会议论文集（5页）

期刊参考： 2018年第四届计算、通信和自动化国际会议（ICCCA），印度格拉特诺伊达，2018年，第1-5页

主题：数字图书馆 (cs.DL) ; 计算机视觉与模式识别 (cs.CV)
[3035] arXiv:2506.21448 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]: 标题： ThinkSound：多模态大语言模型中用于音频生成和编辑的思维链推理

标题： ThinkSound: Chain-of-Thought Reasoning in Multimodal Large Language Models for Audio Generation and Editing

Huadai Liu, Jialei Wang, Kaicheng Luo, Wen Wang, Qian Chen, Zhou Zhao, Wei Xue

主题：音频与语音处理 (eess.AS) ; 计算机视觉与模式识别 (cs.CV) ; 声音 (cs.SD)
[3036] arXiv:2506.21458 (交叉列表自 cs.AI) [中文pdf, pdf, 其他]: 标题：从有限视角的空间心理建模

标题： Spatial Mental Modeling from Limited Views

Baiqiao Yin, Qineng Wang, Pingyue Zhang, Jianshu Zhang, Kangrui Wang, Zihan Wang, Jieyu Zhang, Keshigeyan Chandrasegaran, Han Liu, Ranjay Krishna, Saining Xie, Manling Li, Jiajun Wu, Li Fei-Fei

评论：预印本版本

主题：人工智能 (cs.AI) ; 计算与语言 (cs.CL) ; 计算机视觉与模式识别 (cs.CV)
[3037] arXiv:2506.21499 (交叉列表自 eess.IV) [中文pdf, pdf, html, 其他]: 标题：轻量级物理信息零样本超声平面波去噪

标题： Lightweight Physics-Informed Zero-Shot Ultrasound Plane Wave Denoising

Hojat Asgariandehkordi, Mostafa Sharifzadeh, Hassan Rivaz

主题：图像与视频处理 (eess.IV) ; 计算机视觉与模式识别 (cs.CV)
[3038] arXiv:2506.21535 (交叉列表自 eess.IV) [中文pdf, pdf, html, 其他]: 标题：探索用于CT报告生成的3D MLLMs的设计空间

标题： Exploring the Design Space of 3D MLLMs for CT Report Generation

Mohammed Baharoon, Jun Ma, Congyu Fang, Augustin Toma, Bo Wang

主题：图像与视频处理 (eess.IV) ; 计算机视觉与模式识别 (cs.CV) ; 机器学习 (cs.LG)
[3039] arXiv:2506.21537 (交叉列表自 quant-ph) [中文pdf, pdf, html, 其他]: 标题： ResQ：一种在模拟 Rydberg 原子量子计算机上实现残差神经网络的新框架

标题： ResQ: A Novel Framework to Implement Residual Neural Networks on Analog Rydberg Atom Quantum Computers

Nicholas S. DiBrita, Jason Han, Tirthak Patel

评论： ResQ 将出现在 IEEE 国际计算机视觉会议（ICCV）2025 的论文集上。

主题：量子物理 (quant-ph) ; 计算机视觉与模式识别 (cs.CV) ; 新兴技术 (cs.ET)
[3040] arXiv:2506.21586 (交叉列表自 cs.CL) [中文pdf, pdf, html, 其他]: 标题：视觉语言模型能理解模仿动作吗？

标题： Can Vision Language Models Understand Mimed Actions?

Hyundong Cho, Spencer Lin, Tejas Srinivasan, Michael Saxon, Deuksin Kwon, Natali T. Chavez, Jonathan May

评论： ACL 2025 论文集

主题：计算与语言 (cs.CL) ; 人工智能 (cs.AI) ; 计算机视觉与模式识别 (cs.CV)
[3041] arXiv:2506.21592 (交叉列表自 cs.CL) [中文pdf, pdf, html, 其他]: 标题： SignBart -- 用于孤立手语识别的新方法与骨架序列

标题： SignBart -- New approach with the skeleton sequence for Isolated Sign language Recognition

Tinh Nguyen, Minh Khue Phan Tran

主题：计算与语言 (cs.CL) ; 计算机视觉与模式识别 (cs.CV)
[3042] arXiv:2506.21601 (交叉列表自 cs.IR) [中文pdf, pdf, html, 其他]: 标题：基于层次化补丁压缩的 ColPali：具有动态剪枝和量化高效多向量文档检索

标题： Hierarchical Patch Compression for ColPali: Efficient Multi-Vector Document Retrieval with Dynamic Pruning and Quantization

Duong Bach

评论： 9页

主题：信息检索 (cs.IR) ; 计算机视觉与模式识别 (cs.CV)
[3043] arXiv:2506.21604 (交叉列表自 cs.IR) [中文pdf, pdf, html, 其他]: 标题：评估VisualRAG：量化企业文档理解中的跨模态性能

标题： Evaluating VisualRAG: Quantifying Cross-Modal Performance in Enterprise Document Understanding

Varun Mannam, Fang Wang, Xin Chen

评论：会议：KDD 会议工作坊： https://kdd-eval-workshop.github.io/genai-evaluation-kdd2025/

主题：信息检索 (cs.IR) ; 人工智能 (cs.AI) ; 计算机视觉与模式识别 (cs.CV) ; 人机交互 (cs.HC) ; 机器学习 (cs.LG)
[3044] arXiv:2506.21629 (交叉列表自 cs.GR) [中文pdf, pdf, html, 其他]: 标题： ICP-3DGS：用于大规模无限场景的无SfM三维高斯点云

标题： ICP-3DGS: SfM-free 3D Gaussian Splatting for Large-scale Unbounded Scenes

Chenhao Zhang, Yezhi Shen, Fengqing Zhu

评论： 6页，源代码可在 https://github.com/Chenhao-Z/ICP-3DGS 获取。将发表于ICIP 2025

主题：图形学 (cs.GR)
[3045] arXiv:2506.21630 (交叉列表自 cs.RO) [中文pdf, pdf, html, 其他]: 标题： TOMD：一种基于路径的非公路多模态数据集，用于在具有挑战性的光照条件下可行驶路径分割

标题： TOMD: A Trail-based Off-road Multimodal Dataset for Traversable Pathway Segmentation under Challenging Illumination Conditions

Yixin Sun, Li Li, Wenke E, Amir Atapour-Abarghouei, Toby P. Breckon

评论： 8页，9图，2025 IJCNN

主题：机器人技术 (cs.RO) ; 计算机视觉与模式识别 (cs.CV) ; 机器学习 (cs.LG)
[3046] arXiv:2506.21635 (交叉列表自 cs.RO) [中文pdf, pdf, html, 其他]: 标题： AeroLite-MDNet：用于无人机着陆的轻量级多任务偏差检测网络

标题： AeroLite-MDNet: Lightweight Multi-task Deviation Detection Network for UAV Landing

Haiping Yang, Huaxing Liu, Wei Wu, Zuohui Chen, Ning Wu

主题：机器人技术 (cs.RO) ; 人工智能 (cs.AI) ; 计算机视觉与模式识别 (cs.CV)
[3047] arXiv:2506.21655 (交叉列表自 cs.LG) [中文pdf, pdf, html, 其他]: 标题： APO：通过非对称策略优化增强多模态大语言模型的推理能力

标题： APO: Enhancing Reasoning Ability of MLLMs via Asymmetric Policy Optimization

Minjie Hong, Zirun Guo, Yan Xia, Zehan Wang, Ziang Zhang, Tao Jin, Zhou Zhao

主题：机器学习 (cs.LG) ; 人工智能 (cs.AI) ; 计算机视觉与模式识别 (cs.CV)
[3048] arXiv:2506.21680 (交叉列表自 eess.IV) [中文pdf, pdf, html, 其他]: 标题：光子喷溅：从SPAD传感器进行3D场景重建和着色

标题： PhotonSplat: 3D Scene Reconstruction and Colorization from SPAD Sensors

Sai Sri Teja, Sreevidya Chintalapati, Vinayak Gupta, Mukund Varma T, Haejoon Lee, Aswin Sankaranarayanan, Kaushik Mitra

评论：被国际计算摄影会议（ICCP）2025接受

主题：图像与视频处理 (eess.IV) ; 计算机视觉与模式识别 (cs.CV)
[3049] arXiv:2506.21714 (交叉列表自 cs.LG) [中文pdf, pdf, html, 其他]: 标题：常微分方程$_t$(常微分方程$_l$)：在扩散和流模型中缩短时间和长度以实现更快的采样

标题： ODE$_t$(ODE$_l$): Shortcutting the Time and Length in Diffusion and Flow Models for Faster Sampling

Denis Gudovskiy, Wenzhao Zheng, Tomoyuki Okuno, Yohei Nakata, Kurt Keutzer

评论：预印本。GitHub 页面：github.com/gudovskiy/odelt

主题：机器学习 (cs.LG) ; 计算机视觉与模式识别 (cs.CV)
[3050] arXiv:2506.21732 (交叉列表自 cs.RO) [中文pdf, pdf, html, 其他]: 标题：基于滑动转向的视觉导航的姿态感知强化学习实验研究

标题： Experimental investigation of pose informed reinforcement learning for skid-steered visual navigation

Ameya Salvi, Venkat Krovi

主题：机器人技术 (cs.RO) ; 人工智能 (cs.AI) ; 计算机视觉与模式识别 (cs.CV) ; 机器学习 (cs.LG) ; 系统与控制 (eess.SY)

总共 3129 条目 : 1-25 ... 2951-2975 2976-3000 3001-3025 3026-3050 3051-3075 3076-3100 3101-3125 ... 3126-3129

显示最多 25 每页条目：较少 | 更多 | 所有

计算机视觉与模式识别

2025年06月 的作者和标题

2025年06月的作者和标题