计算机视觉与模式识别

2025年06月的作者和标题

总共 3129 条目 : 1-25 76-100 101-125 126-150 151-175 176-200 201-225 226-250 ... 3126-3129

显示最多 25 每页条目：较少 | 更多 | 所有

[151] arXiv:2506.01783 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： FaceCoT：具有连锁思维推理的面部反欺骗基准数据集

标题： FaceCoT: A Benchmark Dataset for Face Anti-Spoofing with Chain-of-Thought Reasoning

Honglu Zhang, Zhiqin Fang, Ningning Zhao, Saihui Hou, Long Ma, Renwang Pei, Zhaofeng He

主题：计算机视觉与模式识别 (cs.CV)
[152] arXiv:2506.01795 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： R2SM：指代与推理用于选择性掩码

标题： R2SM: Referring and Reasoning for Selective Masks

Yu-Lin Shih, Wei-En Tai, Cheng Sun, Yu-Chiang Frank Wang, Hwann-Tzong Chen

主题：计算机视觉与模式识别 (cs.CV)
[153] arXiv:2506.01799 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： WorldExplorer：迈向生成完全可导航的3D场景

标题： WorldExplorer: Towards Generating Fully Navigable 3D Scenes

Manuel-Andreas Schneider, Lukas Höllein, Matthias Nießner

评论：项目页面：见 https://the-world-explorer.github.io/，视频：见 https://youtu.be/c1lBnwJWNmE

主题：计算机视觉与模式识别 (cs.CV)
[154] arXiv:2506.01801 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： OmniV2V：通过动态内容操作的多功能视频生成与编辑

标题： OmniV2V: Versatile Video Generation and Editing via Dynamic Content Manipulation

Sen Liang, Zhentao Yu, Zhengguang Zhou, Teng Hu, Hongmei Wang, Yi Chen, Qin Lin, Yuan Zhou, Xin Li, Qinglin Lu, Zhibo Chen

主题：计算机视觉与模式识别 (cs.CV)
[155] arXiv:2506.01802 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： UMA：通过多级曲面对齐的超详细人体 avatar

标题： UMA: Ultra-detailed Human Avatars via Multi-level Surface Alignment

Heming Zhu, Guoxing Sun, Christian Theobalt, Marc Habermann

评论：欲查看视频结果，请访问 https://youtu.be/XMNCy7J2tuc

主题：计算机视觉与模式识别 (cs.CV)
[156] arXiv:2506.01806 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： Ridgeformer：细粒度跨域指纹识别的多阶段对比训练

标题： Ridgeformer: Mutli-Stage Contrastive Training For Fine-grained Cross-Domain Fingerprint Recognition

Shubham Pandey, Bhavin Jawade, Srirangaraj Setlur

评论：已被接受发表于2025年IEEE图像处理国际会议

主题：计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI)
[157] arXiv:2506.01822 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： GSCodec工作室：高斯点云压缩的模块化框架

标题： GSCodec Studio: A Modular Framework for Gaussian Splat Compression

Sicheng Li, Chengzhen Wu, Hao Li, Xiang Gao, Yiyi Liao, Lu Yu

评论：项目仓库：https://github.com/JasonLSC/GSCodec_Studio

主题：计算机视觉与模式识别 (cs.CV) ; 多媒体 (cs.MM)
[158] arXiv:2506.01850 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： MoDA：用于细粒度视觉接地的指令调优大模型的调制适配器

标题： MoDA: Modulation Adapter for Fine-Grained Visual Grounding in Instructional MLLMs

Wayner Barrios, Andrés Villa, Juan León Alcázar, SouYoung Jin, Bernard Ghanem

主题：计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI) ; 机器学习 (cs.LG) ; 多媒体 (cs.MM)
[159] arXiv:2506.01853 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： ShapeLLM-Omni：一种用于3D生成和理解的原生多模态大型语言模型

标题： ShapeLLM-Omni: A Native Multimodal LLM for 3D Generation and Understanding

Junliang Ye, Zhengyi Wang, Ruowen Zhao, Shenghao Xie, Jun Zhu

评论：项目页面：https://github.com/JAMESYJL/ShapeLLM-Omni

主题：计算机视觉与模式识别 (cs.CV)
[160] arXiv:2506.01902 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：多尺度预训练与扰动报告判别增强的生物医学多模态表示学习

标题： Enhancing Biomedical Multi-modal Representation Learning with Multi-scale Pre-training and Perturbed Report Discrimination

Xinliu Zhong, Kayhan Batmanghelich, Li Sun

评论： 6页，1幅图，已被2024年IEEE人工智能会议（CAI）接受

期刊参考： 2024年IEEE人工智能会议（CAI），2024年，第480-485页

主题：计算机视觉与模式识别 (cs.CV) ; 计算与语言 (cs.CL)
[161] arXiv:2506.01908 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：视频大语言模型的强化学习调优：奖励设计与数据效率

标题： Reinforcement Learning Tuning for VideoLLMs: Reward Design and Data Efficiency

Hongyu Li, Songhao Han, Yue Liao, Junfeng Luo, Jialin Gao, Shuicheng Yan, Si Liu

主题：计算机视觉与模式识别 (cs.CV)
[162] arXiv:2506.01912 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：阐明无条件去噪扩散模型中图像的表示

标题： Elucidating the representation of images within an unconditional diffusion model denoiser

Zahra Kadkhodaie, Stéphane Mallat, Eero Simoncelli

主题：计算机视觉与模式识别 (cs.CV)
[163] arXiv:2506.01921 (交叉列表自 cs.CV) [中文pdf, pdf, 其他]: 标题： MedEBench：回顾医学领域的文本指导图像编辑

标题： MedEBench: Revisiting Text-instructed Image Editing on Medical Domain

Minghao Liu, Zhitao He, Zhiyuan Fan, Qingyun Wang, Yi R. Fung

评论：项目网站：https://mliuby.github.io/MedEBench_Website/

主题：计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI)
[164] arXiv:2506.01923 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： TaxaDiffusion：用于细粒度物种生成的逐步训练扩散模型

标题： TaxaDiffusion: Progressively Trained Diffusion Model for Fine-Grained Species Generation

Amin Karimi Monsefi, Mridul Khurana, Rajiv Ramnath, Anuj Karpatne, Wei-Lun Chao, Cheng Zhang

评论：被ICCV 2025接受

主题：计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI) ; 机器学习 (cs.LG)
[165] arXiv:2506.01933 (交叉列表自 cs.CV) [中文pdf, pdf, 其他]: 标题： E3D-Bench：端到端3D几何基础模型的基准测试

标题： E3D-Bench: A Benchmark for End-to-End 3D Geometric Foundation Models

Wenyan Cong, Yiqing Liang, Yancheng Zhang, Ziyi Yang, Yan Wang, Boris Ivanovic, Marco Pavone, Chen Chen, Zhangyang Wang, Zhiwen Fan

评论：项目页面：https://e3dbench.github.io/

主题：计算机视觉与模式识别 (cs.CV)
[166] arXiv:2506.01935 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：使用寄存器的低秩头部 avatar 个性化

标题： Low-Rank Head Avatar Personalization with Registers

Sai Tanmay Reddy Chakkera, Aggelina Chatziagapi, Md Moniruzzaman, Chen-Ping Yu, Yi-Hsuan Tsai, Dimitris Samaras

评论： 23页，16幅图。项目页面：https://starc52.github.io/publications/2025-05-28-LoRAvatar/

主题：计算机视觉与模式识别 (cs.CV)
[167] arXiv:2506.01940 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：快速且鲁棒的旋转平均与各向异性坐标下降

标题： Fast and Robust Rotation Averaging with Anisotropic Coordinate Descent

Yaroslava Lochman, Carl Olsson, Christopher Zach

主题：计算机视觉与模式识别 (cs.CV)
[168] arXiv:2506.01942 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： OD3：无优化的数据集蒸馏用于目标检测

标题： OD3: Optimization-free Dataset Distillation for Object Detection

Salwa K. Al Khatib (1), Ahmed ElHagry (1), Shitong Shao (2 and 1), Zhiqiang Shen (1) ((1) Mohamed Bin Zayed University of Artificial Intelligence (MBZUAI), (2) Hong Kong University of Science and Technology (Guangzhou))

评论：第一到第三作者贡献相同

主题：计算机视觉与模式识别 (cs.CV)
[169] arXiv:2506.01943 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：用于机器人操作的学习视频生成与协作轨迹控制

标题： Learning Video Generation for Robotic Manipulation with Collaborative Trajectory Control

Xiao Fu, Xintao Wang, Xian Liu, Jianhong Bai, Runsen Xu, Pengfei Wan, Di Zhang, Dahua Lin

评论：项目页面：https://fuxiao0719.github.io/projects/robomaster/ 代码：https://github.com/KwaiVGI/RoboMaster

主题：计算机视觉与模式识别 (cs.CV)
[170] arXiv:2506.01946 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：大型语言模型需要三维感知表示监督来进行场景理解

标题： MLLMs Need 3D-Aware Representation Supervision for Scene Understanding

Xiaohu Huang, Jingjing Wu, Qunyi Xie, Kai Han

主题：计算机视觉与模式识别 (cs.CV)
[171] arXiv:2506.01949 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： IMAGHarmony：具有恒定物体数量和布局的可控图像编辑

标题： IMAGHarmony: Controllable Image Editing with Consistent Object Quantity and Layout

Fei Shen, Xiaoyu Du, Yutong Gao, Jian Yu, Yushe Cao, Xing Lei, Jinhui Tang

主题：计算机视觉与模式识别 (cs.CV)
[172] arXiv:2506.01955 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：双过程图像生成

标题： Dual-Process Image Generation

Grace Luo, Jonathan Granskog, Aleksander Holynski, Trevor Darrell

主题：计算机视觉与模式识别 (cs.CV) ; 计算与语言 (cs.CL) ; 机器学习 (cs.LG)
[173] arXiv:2506.02010 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： CNVSRC 2024：第二届中国连续视觉语音识别挑战赛

标题： CNVSRC 2024: The Second Chinese Continuous Visual Speech Recognition Challenge

Zehua Liu, Xiaolou Li, Chen Chen, Lantian Li, Dong Wang

评论：将于2025年发表于INTERSPEECH

主题：计算机视觉与模式识别 (cs.CV) ; 声音 (cs.SD) ; 音频与语音处理 (eess.AS)
[174] arXiv:2506.02011 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： OASIS：在线样本选择用于持续视觉指令微调

标题： OASIS: Online Sample Selection for Continual Visual Instruction Tuning

Minjae Lee, Minhyuk Seo, Tingyu Qu, Tinne Tuytelaars, Jonghyun Choi

主题：计算机视觉与模式识别 (cs.CV)
[175] arXiv:2506.02012 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：利用大型语言模型进行视觉语音识别：模型扩展、上下文感知解码和迭代优化

标题： Leveraging Large Language Models in Visual Speech Recognition: Model Scaling, Context-Aware Decoding, and Iterative Polishing

Zehua Liu, Xiaolou Li, Li Guo, Lantian Li, Dong Wang

主题：计算机视觉与模式识别 (cs.CV) ; 声音 (cs.SD) ; 音频与语音处理 (eess.AS)

总共 3129 条目 : 1-25 76-100 101-125 126-150 151-175 176-200 201-225 226-250 ... 3126-3129

显示最多 25 每页条目：较少 | 更多 | 所有

计算机视觉与模式识别

2025年06月 的作者和标题

2025年06月的作者和标题