Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > cs.CV

帮助 | 高级搜索

计算机视觉与模式识别

2025年06月 的作者和标题

总共 3129 条目 : 1-25 76-100 101-125 126-150 151-175 176-200 201-225 226-250 ... 3126-3129
显示最多 25 每页条目: 较少 | 更多 | 所有
[151] arXiv:2506.01783 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: FaceCoT:具有连锁思维推理的面部反欺骗基准数据集
标题: FaceCoT: A Benchmark Dataset for Face Anti-Spoofing with Chain-of-Thought Reasoning
Honglu Zhang, Zhiqin Fang, Ningning Zhao, Saihui Hou, Long Ma, Renwang Pei, Zhaofeng He
主题: 计算机视觉与模式识别 (cs.CV)
[152] arXiv:2506.01795 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: R2SM:指代与推理用于选择性掩码
标题: R2SM: Referring and Reasoning for Selective Masks
Yu-Lin Shih, Wei-En Tai, Cheng Sun, Yu-Chiang Frank Wang, Hwann-Tzong Chen
主题: 计算机视觉与模式识别 (cs.CV)
[153] arXiv:2506.01799 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: WorldExplorer:迈向生成完全可导航的3D场景
标题: WorldExplorer: Towards Generating Fully Navigable 3D Scenes
Manuel-Andreas Schneider, Lukas Höllein, Matthias Nießner
评论: 项目页面:见 https://the-world-explorer.github.io/,视频:见 https://youtu.be/c1lBnwJWNmE
主题: 计算机视觉与模式识别 (cs.CV)
[154] arXiv:2506.01801 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: OmniV2V:通过动态内容操作的多功能视频生成与编辑
标题: OmniV2V: Versatile Video Generation and Editing via Dynamic Content Manipulation
Sen Liang, Zhentao Yu, Zhengguang Zhou, Teng Hu, Hongmei Wang, Yi Chen, Qin Lin, Yuan Zhou, Xin Li, Qinglin Lu, Zhibo Chen
主题: 计算机视觉与模式识别 (cs.CV)
[155] arXiv:2506.01802 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: UMA:通过多级曲面对齐的超详细人体 avatar
标题: UMA: Ultra-detailed Human Avatars via Multi-level Surface Alignment
Heming Zhu, Guoxing Sun, Christian Theobalt, Marc Habermann
评论: 欲查看视频结果,请访问 https://youtu.be/XMNCy7J2tuc
主题: 计算机视觉与模式识别 (cs.CV)
[156] arXiv:2506.01806 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: Ridgeformer:细粒度跨域指纹识别的多阶段对比训练
标题: Ridgeformer: Mutli-Stage Contrastive Training For Fine-grained Cross-Domain Fingerprint Recognition
Shubham Pandey, Bhavin Jawade, Srirangaraj Setlur
评论: 已被接受发表于2025年IEEE图像处理国际会议
主题: 计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI)
[157] arXiv:2506.01822 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: GSCodec工作室:高斯点云压缩的模块化框架
标题: GSCodec Studio: A Modular Framework for Gaussian Splat Compression
Sicheng Li, Chengzhen Wu, Hao Li, Xiang Gao, Yiyi Liao, Lu Yu
评论: 项目仓库:https://github.com/JasonLSC/GSCodec_Studio
主题: 计算机视觉与模式识别 (cs.CV) ; 多媒体 (cs.MM)
[158] arXiv:2506.01850 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: MoDA:用于细粒度视觉接地的指令调优大模型的调制适配器
标题: MoDA: Modulation Adapter for Fine-Grained Visual Grounding in Instructional MLLMs
Wayner Barrios, Andrés Villa, Juan León Alcázar, SouYoung Jin, Bernard Ghanem
主题: 计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI) ; 机器学习 (cs.LG) ; 多媒体 (cs.MM)
[159] arXiv:2506.01853 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: ShapeLLM-Omni:一种用于3D生成和理解的原生多模态大型语言模型
标题: ShapeLLM-Omni: A Native Multimodal LLM for 3D Generation and Understanding
Junliang Ye, Zhengyi Wang, Ruowen Zhao, Shenghao Xie, Jun Zhu
评论: 项目页面:https://github.com/JAMESYJL/ShapeLLM-Omni
主题: 计算机视觉与模式识别 (cs.CV)
[160] arXiv:2506.01902 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 多尺度预训练与扰动报告判别增强的生物医学多模态表示学习
标题: Enhancing Biomedical Multi-modal Representation Learning with Multi-scale Pre-training and Perturbed Report Discrimination
Xinliu Zhong, Kayhan Batmanghelich, Li Sun
评论: 6页,1幅图,已被2024年IEEE人工智能会议(CAI)接受
期刊参考: 2024年IEEE人工智能会议(CAI),2024年,第480-485页
主题: 计算机视觉与模式识别 (cs.CV) ; 计算与语言 (cs.CL)
[161] arXiv:2506.01908 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 视频大语言模型的强化学习调优:奖励设计与数据效率
标题: Reinforcement Learning Tuning for VideoLLMs: Reward Design and Data Efficiency
Hongyu Li, Songhao Han, Yue Liao, Junfeng Luo, Jialin Gao, Shuicheng Yan, Si Liu
主题: 计算机视觉与模式识别 (cs.CV)
[162] arXiv:2506.01912 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 阐明无条件去噪扩散模型中图像的表示
标题: Elucidating the representation of images within an unconditional diffusion model denoiser
Zahra Kadkhodaie, Stéphane Mallat, Eero Simoncelli
主题: 计算机视觉与模式识别 (cs.CV)
[163] arXiv:2506.01921 (交叉列表自 cs.CV) [中文pdf, pdf, 其他]
标题: MedEBench:回顾医学领域的文本指导图像编辑
标题: MedEBench: Revisiting Text-instructed Image Editing on Medical Domain
Minghao Liu, Zhitao He, Zhiyuan Fan, Qingyun Wang, Yi R. Fung
评论: 项目网站:https://mliuby.github.io/MedEBench_Website/
主题: 计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI)
[164] arXiv:2506.01923 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: TaxaDiffusion:用于细粒度物种生成的逐步训练扩散模型
标题: TaxaDiffusion: Progressively Trained Diffusion Model for Fine-Grained Species Generation
Amin Karimi Monsefi, Mridul Khurana, Rajiv Ramnath, Anuj Karpatne, Wei-Lun Chao, Cheng Zhang
评论: 被ICCV 2025接受
主题: 计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI) ; 机器学习 (cs.LG)
[165] arXiv:2506.01933 (交叉列表自 cs.CV) [中文pdf, pdf, 其他]
标题: E3D-Bench:端到端3D几何基础模型的基准测试
标题: E3D-Bench: A Benchmark for End-to-End 3D Geometric Foundation Models
Wenyan Cong, Yiqing Liang, Yancheng Zhang, Ziyi Yang, Yan Wang, Boris Ivanovic, Marco Pavone, Chen Chen, Zhangyang Wang, Zhiwen Fan
评论: 项目页面:https://e3dbench.github.io/
主题: 计算机视觉与模式识别 (cs.CV)
[166] arXiv:2506.01935 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 使用寄存器的低秩头部 avatar 个性化
标题: Low-Rank Head Avatar Personalization with Registers
Sai Tanmay Reddy Chakkera, Aggelina Chatziagapi, Md Moniruzzaman, Chen-Ping Yu, Yi-Hsuan Tsai, Dimitris Samaras
评论: 23页,16幅图。项目页面:https://starc52.github.io/publications/2025-05-28-LoRAvatar/
主题: 计算机视觉与模式识别 (cs.CV)
[167] arXiv:2506.01940 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 快速且鲁棒的旋转平均与各向异性坐标下降
标题: Fast and Robust Rotation Averaging with Anisotropic Coordinate Descent
Yaroslava Lochman, Carl Olsson, Christopher Zach
主题: 计算机视觉与模式识别 (cs.CV)
[168] arXiv:2506.01942 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: OD3:无优化的数据集蒸馏用于目标检测
标题: OD3: Optimization-free Dataset Distillation for Object Detection
Salwa K. Al Khatib (1), Ahmed ElHagry (1), Shitong Shao (2 and 1), Zhiqiang Shen (1) ((1) Mohamed Bin Zayed University of Artificial Intelligence (MBZUAI), (2) Hong Kong University of Science and Technology (Guangzhou))
评论: 第一到第三作者贡献相同
主题: 计算机视觉与模式识别 (cs.CV)
[169] arXiv:2506.01943 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 用于机器人操作的学习视频生成与协作轨迹控制
标题: Learning Video Generation for Robotic Manipulation with Collaborative Trajectory Control
Xiao Fu, Xintao Wang, Xian Liu, Jianhong Bai, Runsen Xu, Pengfei Wan, Di Zhang, Dahua Lin
评论: 项目页面:https://fuxiao0719.github.io/projects/robomaster/ 代码:https://github.com/KwaiVGI/RoboMaster
主题: 计算机视觉与模式识别 (cs.CV)
[170] arXiv:2506.01946 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 大型语言模型需要三维感知表示监督来进行场景理解
标题: MLLMs Need 3D-Aware Representation Supervision for Scene Understanding
Xiaohu Huang, Jingjing Wu, Qunyi Xie, Kai Han
主题: 计算机视觉与模式识别 (cs.CV)
[171] arXiv:2506.01949 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: IMAGHarmony:具有恒定物体数量和布局的可控图像编辑
标题: IMAGHarmony: Controllable Image Editing with Consistent Object Quantity and Layout
Fei Shen, Xiaoyu Du, Yutong Gao, Jian Yu, Yushe Cao, Xing Lei, Jinhui Tang
主题: 计算机视觉与模式识别 (cs.CV)
[172] arXiv:2506.01955 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 双过程图像生成
标题: Dual-Process Image Generation
Grace Luo, Jonathan Granskog, Aleksander Holynski, Trevor Darrell
主题: 计算机视觉与模式识别 (cs.CV) ; 计算与语言 (cs.CL) ; 机器学习 (cs.LG)
[173] arXiv:2506.02010 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: CNVSRC 2024:第二届中国连续视觉语音识别挑战赛
标题: CNVSRC 2024: The Second Chinese Continuous Visual Speech Recognition Challenge
Zehua Liu, Xiaolou Li, Chen Chen, Lantian Li, Dong Wang
评论: 将于2025年发表于INTERSPEECH
主题: 计算机视觉与模式识别 (cs.CV) ; 声音 (cs.SD) ; 音频与语音处理 (eess.AS)
[174] arXiv:2506.02011 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: OASIS:在线样本选择用于持续视觉指令微调
标题: OASIS: Online Sample Selection for Continual Visual Instruction Tuning
Minjae Lee, Minhyuk Seo, Tingyu Qu, Tinne Tuytelaars, Jonghyun Choi
主题: 计算机视觉与模式识别 (cs.CV)
[175] arXiv:2506.02012 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 利用大型语言模型进行视觉语音识别:模型扩展、上下文感知解码和迭代优化
标题: Leveraging Large Language Models in Visual Speech Recognition: Model Scaling, Context-Aware Decoding, and Iterative Polishing
Zehua Liu, Xiaolou Li, Li Guo, Lantian Li, Dong Wang
主题: 计算机视觉与模式识别 (cs.CV) ; 声音 (cs.SD) ; 音频与语音处理 (eess.AS)
总共 3129 条目 : 1-25 76-100 101-125 126-150 151-175 176-200 201-225 226-250 ... 3126-3129
显示最多 25 每页条目: 较少 | 更多 | 所有
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号