Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > cs.CV

帮助 | 高级搜索

计算机视觉与模式识别

2025年06月 的作者和标题

总共 3129 条目 : 1-25 ... 2951-2975 2976-3000 3001-3025 3026-3050 3051-3075 3076-3100 3101-3125 ... 3126-3129
显示最多 25 每页条目: 较少 | 更多 | 所有
[3026] arXiv:2506.20990 (交叉列表自 cs.LG) [中文pdf, pdf, html, 其他]
标题: SharpZO:通过仅前向传递的混合锐度感知视觉语言模型提示微调
标题: SharpZO: Hybrid Sharpness-Aware Vision Language Model Prompt Tuning via Forward-Only Passes
Yifan Yang, Zhen Zhang, Rupak Vignesh Swaminathan, Jing Liu, Nathan Susanj, Zheng Zhang
主题: 机器学习 (cs.LG) ; 计算与语言 (cs.CL) ; 计算机视觉与模式识别 (cs.CV)
[3027] arXiv:2506.21037 (交叉列表自 cs.LG) [中文pdf, pdf, html, 其他]
标题: RL-Selector:通过冗余评估的强化学习引导数据选择
标题: RL-Selector: Reinforcement Learning-Guided Data Selection via Redundancy Assessment
Suorong Yang, Peijia Li, Furao Shen, Jian Zhao
评论: ICCV 2025
期刊参考: ICCV 2025
主题: 机器学习 (cs.LG) ; 计算机视觉与模式识别 (cs.CV)
[3028] arXiv:2506.21041 (交叉列表自 cs.RO) [中文pdf, pdf, html, 其他]
标题: SEAL:基于视觉-语言模型的安全端到端协同自动驾驶自适应长尾建模
标题: SEAL: Vision-Language Model-Based Safe End-to-End Cooperative Autonomous Driving with Adaptive Long-Tail Modeling
Junwei You, Pei Li, Zhuoyu Jiang, Zilin Huang, Rui Gan, Haotian Shi, Bin Ran
主题: 机器人技术 (cs.RO) ; 人工智能 (cs.AI) ; 计算机视觉与模式识别 (cs.CV)
[3029] arXiv:2506.21144 (交叉列表自 cs.LG) [中文pdf, pdf, html, 其他]
标题: 通过双提示优化和跨融合的个性化联邦学习
标题: Personalized Federated Learning via Dual-Prompt Optimization and Cross Fusion
Yuguang Zhang, Kuangpu Guo, Zhihe Lu, Yunbo Wang, Jian Liang
主题: 机器学习 (cs.LG) ; 计算机视觉与模式识别 (cs.CV)
[3030] arXiv:2506.21171 (交叉列表自 eess.IV) [中文pdf, pdf, 其他]
标题: 在DCT中发现宝藏:通过利用潜在相关性提升JPEG质量
标题: Uncover Treasures in DCT: Advancing JPEG Quality Enhancement by Exploiting Latent Correlations
Jing Yang, Qunliang Xing, Mai Xu, Minglang Qiao
主题: 图像与视频处理 (eess.IV) ; 计算机视觉与模式识别 (cs.CV)
[3031] arXiv:2506.21245 (交叉列表自 eess.IV) [中文pdf, pdf, html, 其他]
标题: GANet-Seg:基于混合生成模型的对抗学习在脑肿瘤分割中的应用
标题: GANet-Seg: Adversarial Learning for Brain Tumor Segmentation with Hybrid Generative Models
Qifei Cui, Xinyu Lu
主题: 图像与视频处理 (eess.IV) ; 计算机视觉与模式识别 (cs.CV)
[3032] arXiv:2506.21272 (交叉列表自 cs.GR) [中文pdf, pdf, html, 其他]
标题: FairyGen:从单个儿童绘制的角色生成故事漫画视频
标题: FairyGen: Storied Cartoon Video from a Single Child-Drawn Character
Jiayi Zheng, Xiaodong Cun
评论: 项目页面:https://jayleejia.github.io/FairyGen/ ; 代码:https://github.com/GVCLab/FairyGen
主题: 图形学 (cs.GR) ; 计算机视觉与模式识别 (cs.CV) ; 多媒体 (cs.MM)
[3033] arXiv:2506.21319 (交叉列表自 cs.HC) [中文pdf, pdf, html, 其他]
标题: SimVecVis:用于增强可视化理解的多模态大语言模型数据集
标题: SimVecVis: A Dataset for Enhancing MLLMs in Visualization Understanding
Can Liu, Chunlin Da, Xiaoxiao Long, Yuxiao Yang, Yu Zhang, Yong Wang
主题: 人机交互 (cs.HC) ; 计算机视觉与模式识别 (cs.CV)
[3034] arXiv:2506.21331 (交叉列表自 cs.DL) [中文pdf, pdf, html, 其他]
标题: 基于联盟参考文献和出版物权重的论文自动审稿人分配
标题: Automatic Reviewers Assignment to a Research Paper Based on Allied References and Publications Weight
Tamim Al Mahmud, B M Mainul Hossain, Dilshad Ara
评论: IEEE会议论文集(5页)
期刊参考: 2018年第四届计算、通信和自动化国际会议(ICCCA),印度格拉特诺伊达,2018年,第1-5页
主题: 数字图书馆 (cs.DL) ; 计算机视觉与模式识别 (cs.CV)
[3035] arXiv:2506.21448 (交叉列表自 eess.AS) [中文pdf, pdf, html, 其他]
标题: ThinkSound:多模态大语言模型中用于音频生成和编辑的思维链推理
标题: ThinkSound: Chain-of-Thought Reasoning in Multimodal Large Language Models for Audio Generation and Editing
Huadai Liu, Jialei Wang, Kaicheng Luo, Wen Wang, Qian Chen, Zhou Zhao, Wei Xue
主题: 音频与语音处理 (eess.AS) ; 计算机视觉与模式识别 (cs.CV) ; 声音 (cs.SD)
[3036] arXiv:2506.21458 (交叉列表自 cs.AI) [中文pdf, pdf, 其他]
标题: 从有限视角的空间心理建模
标题: Spatial Mental Modeling from Limited Views
Baiqiao Yin, Qineng Wang, Pingyue Zhang, Jianshu Zhang, Kangrui Wang, Zihan Wang, Jieyu Zhang, Keshigeyan Chandrasegaran, Han Liu, Ranjay Krishna, Saining Xie, Manling Li, Jiajun Wu, Li Fei-Fei
评论: 预印本版本
主题: 人工智能 (cs.AI) ; 计算与语言 (cs.CL) ; 计算机视觉与模式识别 (cs.CV)
[3037] arXiv:2506.21499 (交叉列表自 eess.IV) [中文pdf, pdf, html, 其他]
标题: 轻量级物理信息零样本超声平面波去噪
标题: Lightweight Physics-Informed Zero-Shot Ultrasound Plane Wave Denoising
Hojat Asgariandehkordi, Mostafa Sharifzadeh, Hassan Rivaz
主题: 图像与视频处理 (eess.IV) ; 计算机视觉与模式识别 (cs.CV)
[3038] arXiv:2506.21535 (交叉列表自 eess.IV) [中文pdf, pdf, html, 其他]
标题: 探索用于CT报告生成的3D MLLMs的设计空间
标题: Exploring the Design Space of 3D MLLMs for CT Report Generation
Mohammed Baharoon, Jun Ma, Congyu Fang, Augustin Toma, Bo Wang
主题: 图像与视频处理 (eess.IV) ; 计算机视觉与模式识别 (cs.CV) ; 机器学习 (cs.LG)
[3039] arXiv:2506.21537 (交叉列表自 quant-ph) [中文pdf, pdf, html, 其他]
标题: ResQ:一种在模拟 Rydberg 原子量子计算机上实现残差神经网络的新框架
标题: ResQ: A Novel Framework to Implement Residual Neural Networks on Analog Rydberg Atom Quantum Computers
Nicholas S. DiBrita, Jason Han, Tirthak Patel
评论: ResQ 将出现在 IEEE 国际计算机视觉会议(ICCV)2025 的论文集上。
主题: 量子物理 (quant-ph) ; 计算机视觉与模式识别 (cs.CV) ; 新兴技术 (cs.ET)
[3040] arXiv:2506.21586 (交叉列表自 cs.CL) [中文pdf, pdf, html, 其他]
标题: 视觉语言模型能理解模仿动作吗?
标题: Can Vision Language Models Understand Mimed Actions?
Hyundong Cho, Spencer Lin, Tejas Srinivasan, Michael Saxon, Deuksin Kwon, Natali T. Chavez, Jonathan May
评论: ACL 2025 论文集
主题: 计算与语言 (cs.CL) ; 人工智能 (cs.AI) ; 计算机视觉与模式识别 (cs.CV)
[3041] arXiv:2506.21592 (交叉列表自 cs.CL) [中文pdf, pdf, html, 其他]
标题: SignBart -- 用于孤立手语识别的新方法与骨架序列
标题: SignBart -- New approach with the skeleton sequence for Isolated Sign language Recognition
Tinh Nguyen, Minh Khue Phan Tran
主题: 计算与语言 (cs.CL) ; 计算机视觉与模式识别 (cs.CV)
[3042] arXiv:2506.21601 (交叉列表自 cs.IR) [中文pdf, pdf, html, 其他]
标题: 基于层次化补丁压缩的 ColPali:具有动态剪枝和量化高效多向量文档检索
标题: Hierarchical Patch Compression for ColPali: Efficient Multi-Vector Document Retrieval with Dynamic Pruning and Quantization
Duong Bach
评论: 9页
主题: 信息检索 (cs.IR) ; 计算机视觉与模式识别 (cs.CV)
[3043] arXiv:2506.21604 (交叉列表自 cs.IR) [中文pdf, pdf, html, 其他]
标题: 评估VisualRAG:量化企业文档理解中的跨模态性能
标题: Evaluating VisualRAG: Quantifying Cross-Modal Performance in Enterprise Document Understanding
Varun Mannam, Fang Wang, Xin Chen
评论: 会议:KDD 会议 工作坊: https://kdd-eval-workshop.github.io/genai-evaluation-kdd2025/
主题: 信息检索 (cs.IR) ; 人工智能 (cs.AI) ; 计算机视觉与模式识别 (cs.CV) ; 人机交互 (cs.HC) ; 机器学习 (cs.LG)
[3044] arXiv:2506.21629 (交叉列表自 cs.GR) [中文pdf, pdf, html, 其他]
标题: ICP-3DGS:用于大规模无限场景的无SfM三维高斯点云
标题: ICP-3DGS: SfM-free 3D Gaussian Splatting for Large-scale Unbounded Scenes
Chenhao Zhang, Yezhi Shen, Fengqing Zhu
评论: 6页,源代码可在 https://github.com/Chenhao-Z/ICP-3DGS 获取。将发表于ICIP 2025
主题: 图形学 (cs.GR)
[3045] arXiv:2506.21630 (交叉列表自 cs.RO) [中文pdf, pdf, html, 其他]
标题: TOMD:一种基于路径的非公路多模态数据集,用于在具有挑战性的光照条件下可行驶路径分割
标题: TOMD: A Trail-based Off-road Multimodal Dataset for Traversable Pathway Segmentation under Challenging Illumination Conditions
Yixin Sun, Li Li, Wenke E, Amir Atapour-Abarghouei, Toby P. Breckon
评论: 8页,9图,2025 IJCNN
主题: 机器人技术 (cs.RO) ; 计算机视觉与模式识别 (cs.CV) ; 机器学习 (cs.LG)
[3046] arXiv:2506.21635 (交叉列表自 cs.RO) [中文pdf, pdf, html, 其他]
标题: AeroLite-MDNet:用于无人机着陆的轻量级多任务偏差检测网络
标题: AeroLite-MDNet: Lightweight Multi-task Deviation Detection Network for UAV Landing
Haiping Yang, Huaxing Liu, Wei Wu, Zuohui Chen, Ning Wu
主题: 机器人技术 (cs.RO) ; 人工智能 (cs.AI) ; 计算机视觉与模式识别 (cs.CV)
[3047] arXiv:2506.21655 (交叉列表自 cs.LG) [中文pdf, pdf, html, 其他]
标题: APO:通过非对称策略优化增强多模态大语言模型的推理能力
标题: APO: Enhancing Reasoning Ability of MLLMs via Asymmetric Policy Optimization
Minjie Hong, Zirun Guo, Yan Xia, Zehan Wang, Ziang Zhang, Tao Jin, Zhou Zhao
主题: 机器学习 (cs.LG) ; 人工智能 (cs.AI) ; 计算机视觉与模式识别 (cs.CV)
[3048] arXiv:2506.21680 (交叉列表自 eess.IV) [中文pdf, pdf, html, 其他]
标题: 光子喷溅:从SPAD传感器进行3D场景重建和着色
标题: PhotonSplat: 3D Scene Reconstruction and Colorization from SPAD Sensors
Sai Sri Teja, Sreevidya Chintalapati, Vinayak Gupta, Mukund Varma T, Haejoon Lee, Aswin Sankaranarayanan, Kaushik Mitra
评论: 被国际计算摄影会议(ICCP)2025接受
主题: 图像与视频处理 (eess.IV) ; 计算机视觉与模式识别 (cs.CV)
[3049] arXiv:2506.21714 (交叉列表自 cs.LG) [中文pdf, pdf, html, 其他]
标题: 常微分方程$_t$(常微分方程$_l$):在扩散和流模型中缩短时间和长度以实现更快的采样
标题: ODE$_t$(ODE$_l$): Shortcutting the Time and Length in Diffusion and Flow Models for Faster Sampling
Denis Gudovskiy, Wenzhao Zheng, Tomoyuki Okuno, Yohei Nakata, Kurt Keutzer
评论: 预印本。GitHub 页面:github.com/gudovskiy/odelt
主题: 机器学习 (cs.LG) ; 计算机视觉与模式识别 (cs.CV)
[3050] arXiv:2506.21732 (交叉列表自 cs.RO) [中文pdf, pdf, html, 其他]
标题: 基于滑动转向的视觉导航的姿态感知强化学习实验研究
标题: Experimental investigation of pose informed reinforcement learning for skid-steered visual navigation
Ameya Salvi, Venkat Krovi
主题: 机器人技术 (cs.RO) ; 人工智能 (cs.AI) ; 计算机视觉与模式识别 (cs.CV) ; 机器学习 (cs.LG) ; 系统与控制 (eess.SY)
总共 3129 条目 : 1-25 ... 2951-2975 2976-3000 3001-3025 3026-3050 3051-3075 3076-3100 3101-3125 ... 3126-3129
显示最多 25 每页条目: 较少 | 更多 | 所有
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号