计算机视觉与模式识别

最近提交的作者和标题

查看今天的新的变化

总共 954 条目 : 1-50 51-100 101-150 151-200 201-250 ... 951-954

显示最多 50 每页条目：较少 | 更多 | 所有

[51] arXiv:2507.04792 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：基于逐步通道剪枝的模型压缩

标题： Model Compression using Progressive Channel Pruning

Jinyang Guo, Weichen Zhang, Wanli Ouyang, Dong Xu

主题：计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI)
[52] arXiv:2507.04769 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：从模仿到创新：人工智能独特艺术风格的出现与版权保护的挑战

标题： From Imitation to Innovation: The Emergence of AI Unique Artistic Styles and the Challenge of Copyright Protection

Zexi Jia, Chuanwei Huang, Yeshuang Zhu, Hongyan Fei, Ying Deng, Zhiqiang Yuan, Jiapei Zhang, Jinchao Zhang, Jie Zhou

主题：计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI)
[53] arXiv:2507.04765 (交叉列表自 cs.CV) [中文pdf, pdf, 其他]: 标题： GraphBrep：在图结构中学习B-Rep以实现高效的CAD生成

标题： GraphBrep: Learning B-Rep in Graph Structure for Efficient CAD Generation

Weilin Lai, Tie Xu, Hu Wang

主题：计算机视觉与模式识别 (cs.CV)
[54] arXiv:2507.04762 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：通过最小二乘多智能体图的目标跟踪增强3D感知

标题： Robustifying 3D Perception through Least-Squares Multi-Agent Graphs Object Tracking

Maria Damanaki, Ioulia Kapsali, Nikos Piperigkos, Alexandros Gkillas, Aris S. Lalos

评论： 6页，3图，4表

主题：计算机视觉与模式识别 (cs.CV)
[55] arXiv:2507.04750 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： MCFormer：多成本体积网络及粒子图像测速的综合基准

标题： MCFormer: A Multi-Cost-Volume Network and Comprehensive Benchmark for Particle Image Velocimetry

Zicheng Lin (International School, Beijing University of Posts and Telecommunications), Xiaoqiang Li (College of Engineering, Peking University), Yichao Wang (College of Physics and Optoelectronic Engineering, Harbin Engineering University), Chuan Zhu (School of Artificial Intelligence, Beijing University of Posts and Telecommunications)

评论： 20页，13图，5表。对PIV光学流模型的全面基准评估。介绍了MCFormer架构，具有多帧时间处理和多个成本体积。包括基于JHTDB和Blasius CFD模拟的大规模合成PIV数据集。代码和数据集将公开提供

主题：计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI)
[56] arXiv:2507.04749 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： MatDecompSDF：多视角图像中高保真3D形状和PBR材质分解

标题： MatDecompSDF: High-Fidelity 3D Shape and PBR Material Decomposition from Multi-View Images

Chengyu Wang, Isabella Bennett, Henry Scott, Liang Zhang, Mei Chen, Hao Li, Rui Zhao

评论： 12页，4图

主题：计算机视觉与模式识别 (cs.CV)
[57] arXiv:2507.04741 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：视觉-语言模型看不到明显的内容

标题： Vision-Language Models Can't See the Obvious

Yasser Dahou, Ngoc Dung Huynh, Phuc H. Le-Khac, Wamiq Reyaz Para, Ankit Singh, Sanath Narayan

主题：计算机视觉与模式识别 (cs.CV)
[58] arXiv:2507.04735 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：视觉-语言模型在织物检索中的分析

标题： An analysis of vision-language models for fabric retrieval

Francesco Giuliari, Asif Khan Pattan, Mohamed Lamine Mekhalfi, Fabio Poiesi

评论：已被Ital-IA 2025接收

主题：计算机视觉与模式识别 (cs.CV)
[59] arXiv:2507.04726 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：失控：通过ControlNet的引导扩散数据中毒攻击

标题： Losing Control: Data Poisoning Attack on Guided Diffusion via ControlNet

Raz Lapid, Almog Dubin

主题：计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI)
[60] arXiv:2507.04725 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：释放神经坍缩的力量：用于广义类别发现的一致监督-非监督对齐

标题： Unleashing the Power of Neural Collapse: Consistent Supervised-Unsupervised Alignment for Generalized Category Discovery

Jizhou Han, Shaokun Wang, Yuhang He, Chenhao Ding, Qiang Wang, Xinyuan Gao, SongLin Dong, Yihong Gong

主题：计算机视觉与模式识别 (cs.CV)
[61] arXiv:2507.04710 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：基于人类中心基础模型的几何引导少样本牙科标志点检测

标题： Geometric-Guided Few-Shot Dental Landmark Detection with Human-Centric Foundation Model

Anbang Wang, Marawan Elbatel, Keyuan Liu, Lizhuo Lin, Meng Lan, Yanqi Yang, Xiaomeng Li

评论： MICCAI 2025

主题：计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI) ; 机器学习 (cs.LG)
[62] arXiv:2507.04705 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：保持身份的文本到视频生成，由简单而有效的时空解耦表示引导

标题： Identity-Preserving Text-to-Video Generation Guided by Simple yet Effective Spatial-Temporal Decoupled Representations

Yuji Wang, Moran Li, Xiaobin Hu, Ran Yi, Jiangning Zhang, Han Feng, Weijian Cao, Yabiao Wang, Chengjie Wang, Lizhuang Ma

主题：计算机视觉与模式识别 (cs.CV)
[63] arXiv:2507.04702 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： Tempo-R0：通过高效时间感知强化学习进行时间视频定位的视频-MLLM

标题： Tempo-R0: A Video-MLLM for Temporal Video Grounding through Efficient Temporal Sensing Reinforcement Learning

Feng Yue, Zhaoxing Zhang, Junming Jiao, Zhengyu Liang, Shiwen Cao, Feifei Zhang, Rong Shen

主题：计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI)
[64] arXiv:2507.04699 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：通过生成反事实集合在CLIP组合性推理中的视觉飞跃

标题： A Visual Leap in CLIP Compositionality Reasoning through Generation of Counterfactual Sets

Zexi Jia, Chuanwei Huang, Hongyan Fei, Yeshuang Zhu, Zhiqiang Yuan, Ying Deng, Jiapei Zhang, Jinchao Zhang, Jie Zhou

主题：计算机视觉与模式识别 (cs.CV)
[65] arXiv:2507.04692 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：基于结构引导的扩散模型用于高保真人像阴影去除

标题： Structure-Guided Diffusion Models for High-Fidelity Portrait Shadow Removal

Wanchang Yu, Qing Zhang, Rongjia Zheng, Wei-Shi Zheng

主题：计算机视觉与模式识别 (cs.CV)
[66] arXiv:2507.04685 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：牙齿生成器：成对正畸前和正畸后三维牙科数据生成的两阶段框架

标题： TeethGenerator: A two-stage framework for paired pre- and post-orthodontic 3D dental data generation

Changsong Lei, Yaqian Liang, Shaofeng Wang, Jiajia Dai, Yong-Jin Liu

评论：被ICCV 2025接收

主题：计算机视觉与模式识别 (cs.CV)
[67] arXiv:2507.04681 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：结直肠癌肿瘤分级分割在数字病理学图像中：从大到小的挑战

标题： Colorectal Cancer Tumor Grade Segmentation in Digital Histopathology Images: From Giga to Mini Challenge

Alper Bahcekapili, Duygu Arslan, Umut Ozdemir, Berkay Ozkirli, Emre Akbas, Ahmet Acar, Gozde B. Akar, Bingdou He, Shuoyu Xu, Umit Mert Caglar, Alptekin Temizel, Guillaume Picaud, Marc Chaumont, Gérard Subsol, Luc Téot, Fahad Alsharekh, Shahad Alghannam, Hexiang Mao, Wenhua Zhang

评论：接受的主旨演讲论文 ICIP 2025

主题：计算机视觉与模式识别 (cs.CV)
[68] arXiv:2507.04678 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： ChangeBridge：多模态控制的时空图像生成用于遥感

标题： ChangeBridge: Spatiotemporal Image Generation with Multimodal Controls for Remote Sensing

Zhenghui Zhao, Chen Wu, Di Wang, Hongruixuan Chen, Zhuo Zheng

主题：计算机视觉与模式识别 (cs.CV)
[69] arXiv:2507.04667 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：现在是什么在发出声音？以视频为中心的音视频定位

标题： What's Making That Sound Right Now? Video-centric Audio-Visual Localization

Hahyeon Choi, Junhoo Lee, Nojun Kwak

评论：发表于ICCV 2025。项目页面：https://hahyeon610.github.io/Video-centric_Audio_Visual_Localization/

主题：计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI) ; 多媒体 (cs.MM) ; 声音 (cs.SD) ; 音频与语音处理 (eess.AS)
[70] arXiv:2507.04664 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： VectorLLM：通过多模态大语言模型实现结构化建筑轮廓的人类似提取

标题： VectorLLM: Human-like Extraction of Structured Building Contours vis Multimodal LLMs

Tao Zhang, Shiqing Wei, Shihao Chen, Wenling Yu, Muying Luo, Shunping Ji

主题：计算机视觉与模式识别 (cs.CV)
[71] arXiv:2507.04638 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： UGG-ReID：基于不确定性引导的图模型的多模态目标重识别

标题： UGG-ReID: Uncertainty-Guided Graph Model for Multi-Modal Object Re-Identification

Xixi Wan, Aihua Zheng, Bo Jiang, Beibei Wang, Chenglong Li, Jin Tang

主题：计算机视觉与模式识别 (cs.CV)
[72] arXiv:2507.04635 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： MODA：多模态感知、认知和情感理解的模块化双工注意力

标题： MODA: MOdular Duplex Attention for Multimodal Perception, Cognition, and Emotion Understanding

Zhicheng Zhang, Wuyou Xia, Chenxi Zhao, Zhou Yan, Xiaoqiang Liu, Yongjie Zhu, Wenyu Qin, Pengfei Wan, Di Zhang, Jufeng Yang

评论： ICML 2025（亮点论文，前2.6%）

主题：计算机视觉与模式识别 (cs.CV)
[73] arXiv:2507.04634 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： LTMSformer：一种用于多智能体轨迹预测的局部趋势感知注意力和运动状态编码变压器

标题： LTMSformer: A Local Trend-Aware Attention and Motion State Encoding Transformer for Multi-Agent Trajectory Prediction

Yixin Yan, Yang Li, Yuanfan Wang, Xiaozhou Zhou, Beihao Xia, Manjiang Hu, Hongmao Qin

主题：计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI)
[74] arXiv:2507.04631 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：在野外使用选择性专家混合进行鲁棒立体匹配学习

标题： Learning Robust Stereo Matching in the Wild with Selective Mixture-of-Experts

Yun Wang, Longguang Wang, Chenghao Zhang, Yongjian Zhang, Zhanjie Zhang, Ao Ma, Chenyou Fan, Tin Lun Lam, Junjie Hu

期刊参考： ICCV 2025

主题：计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI) ; 机器人技术 (cs.RO)
[75] arXiv:2507.04630 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：通过主动选择和重新标注更好地学习3D VQA

标题： Learn 3D VQA Better with Active Selection and Reannotation

Shengli Zhou, Yang Liu, Feng Zheng

评论：被ACM MM 2025接受

主题：计算机视觉与模式识别 (cs.CV)
[76] arXiv:2507.04613 (交叉列表自 cs.CV) [中文pdf, pdf, 其他]: 标题： HiLa：用于癌症生存预测的分层视觉-语言协作

标题： HiLa: Hierarchical Vision-Language Collaboration for Cancer Survival Prediction

Jiaqi Cui, Lu Wen, Yuchen Fei, Bo Liu, Luping Zhou, Dinggang Shen, Yan Wang

评论：被MICCAI 2025接受

主题：计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI)
[77] arXiv:2507.04599 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： QR-LoRA：通过QR分解进行高效且解耦的微调以实现定制生成

标题： QR-LoRA: Efficient and Disentangled Fine-tuning via QR Decomposition for Customized Generation

Jiahui Yang, Yongjia Ma, Donglin Di, Hao Li, Wei Chen, Yan Xie, Jianxun Cui, Xun Yang, Wangmeng Zuo

评论： ICCV 2025，30页，26图

主题：计算机视觉与模式识别 (cs.CV)
[78] arXiv:2507.04590 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： VLM2Vec-V2：推动视频、图像和视觉文档的多模态嵌入

标题： VLM2Vec-V2: Advancing Multimodal Embedding for Videos, Images, and Visual Documents

Rui Meng, Ziyan Jiang, Ye Liu, Mingyi Su, Xinyi Yang, Yuepeng Fu, Can Qin, Zeyuan Chen, Ran Xu, Caiming Xiong, Yingbo Zhou, Wenhu Chen, Semih Yavuz

评论：技术报告

主题：计算机视觉与模式识别 (cs.CV) ; 计算与语言 (cs.CL)
[79] arXiv:2507.04587 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： CVFusion：4D雷达与相机的跨视图融合用于3D目标检测

标题： CVFusion: Cross-View Fusion of 4D Radar and Camera for 3D Object Detection

Hanzhi Zhong, Zhiyu Xiang, Ruoyu Xu, Jingyun Fu, Peng Xu, Shaohong Wang, Zhihao Yang, Tianyu Pu, Eryun Liu

主题：计算机视觉与模式识别 (cs.CV)
[80] arXiv:2507.04584 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： S$^2$编辑：具有精确语义和空间控制的文本引导图像编辑

标题： S$^2$Edit: Text-Guided Image Editing with Precise Semantic and Spatial Control

Xudong Liu, Zikun Chen, Ruowei Jiang, Ziyi Wu, Kejia Yin, Han Zhao, Parham Aarabi, Igor Gilitschenski

主题：计算机视觉与模式识别 (cs.CV)
[81] arXiv:2507.04559 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： MambaVideo 用于具有通道分割量化的离散视频标记化

标题： MambaVideo for Discrete Video Tokenization with Channel-Split Quantization

Dawit Mureja Argaw, Xian Liu, Joon Son Chung, Ming-Yu Liu, Fitsum Reda

评论：项目网站：https://research.nvidia.com/labs/dir/mamba-tokenizer/

主题：计算机视觉与模式识别 (cs.CV)
[82] arXiv:2507.04529 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：一种用于多样化车载数据记录的数据驱动新颖性评分

标题： A Data-Driven Novelty Score for Diverse In-Vehicle Data Recording

Philipp Reis, Joshua Ransiek, David Petri, Jacob Langner, Eric Sax

评论： 8页，被IEEE ITSC 2025接收

主题：计算机视觉与模式识别 (cs.CV)
[83] arXiv:2507.04522 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：基于地面的手势生成：语言、运动和空间

标题： Grounded Gesture Generation: Language, Motion, and Space

Anna Deichler, Jim O'Regan, Teo Guichoux, David Johansson, Jonas Beskow

评论：被接受为CVPR 2025仿人智能体研讨会的非档案论文。项目页面：https://groundedgestures.github.io

主题：计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI) ; 机器人技术 (cs.RO)
[84] arXiv:2507.04511 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： FA：用于分布外检测的视觉-语言模型强制提示学习

标题： FA: Forced Prompt Learning of Vision-Language Models for Out-of-Distribution Detection

Xinhua Lu, Runhe Lai, Yanqi Wu, Kanghao Chen, Wei-Shi Zheng, Ruixuan Wang

主题：计算机视觉与模式识别 (cs.CV)
[85] arXiv:2507.04509 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： MVL-Loc：利用视觉语言模型进行可泛化的多场景相机重新定位

标题： MVL-Loc: Leveraging Vision-Language Model for Generalizable Multi-Scene Camera Relocalization

Zhendong Xiao, Wu Wei, Shujie Ji, Shan Yang, Changhao Chen

评论：模式识别与计算机视觉

主题：计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI)
[86] arXiv:2507.04503 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： U-ViLAR：通过可微关联和配准的不确定性感知自主驾驶视觉定位

标题： U-ViLAR: Uncertainty-Aware Visual Localization for Autonomous Driving via Differentiable Association and Registration

Xiaofan Li, Zhihao Xu, Chenming Wu, Zhao Yang, Yumeng Zhang, Jiang-Jiang Liu, Haibao Yu, Fan Duan, Xiaoqing Ye, Yuan Wang, Shirui Li, Xun Sun, Ji Wan, Jun Wang

评论：视觉定位，自动驾驶，鸟瞰图

主题：计算机视觉与模式识别 (cs.CV) ; 机器人技术 (cs.RO)
[87] arXiv:2507.04482 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：一种无需训练的尺度自回归模型风格个性化

标题： A Training-Free Style-Personalization via Scale-wise Autoregressive Model

Kyoungmin Lee, Jihun Park, Jongmin Gim, Wonhyeok Choi, Kyumin Hwang, Jaeyeul Kim, Sunghoon Im

评论： 13页，10图

主题：计算机视觉与模式识别 (cs.CV)
[88] arXiv:2507.04465 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：基于深度学习的视觉手部手势识别：方法、数据集、挑战与未来研究方向的全面综述

标题： Visual Hand Gesture Recognition with Deep Learning: A Comprehensive Review of Methods, Datasets, Challenges and Future Research Directions

Konstantinos Foteinos, Jorgen Cani, Manousos Linardakis, Panagiotis Radoglou-Grammatikis, Vasileios Argyriou, Panagiotis Sarigiannidis, Iraklis Varlamis, Georgios Th. Papadopoulos

主题：计算机视觉与模式识别 (cs.CV)
[89] arXiv:2507.04456 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： BiVM：用于高效视频抠图的精确二值化神经网络

标题： BiVM: Accurate Binarized Neural Network for Efficient Video Matting

Haotong Qin, Xianglong Liu, Xudong Ma, Lei Ke, Yulun Zhang, Jie Luo, Michele Magno

主题：计算机视觉与模式识别 (cs.CV)
[90] arXiv:2507.04451 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： CoT-增强的扩散：让我们逐步强化文本到图像生成

标题： CoT-lized Diffusion: Let's Reinforce T2I Generation Step-by-step

Zheyuan Liu, Munan Ning, Qihui Zhang, Shuo Yang, Zhongrui Wang, Yiwei Yang, Xianzhe Xu, Yibing Song, Weihua Chen, Fan Wang, Li Yuan

主题：计算机视觉与模式识别 (cs.CV)
[91] arXiv:2507.04447 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： DreamVLA：一个融合全面世界知识的视觉-语言-动作模型

标题： DreamVLA: A Vision-Language-Action Model Dreamed with Comprehensive World Knowledge

Wenyao Zhang, Hongsi Liu, Zekun Qi, Yunnan Wang, XinQiang Yu, Jiazhao Zhang, Runpei Dong, Jiawei He, He Wang, Zhizheng Zhang, Li Yi, Wenjun Zeng, Xin Jin

主题：计算机视觉与模式识别 (cs.CV) ; 机器人技术 (cs.RO)
[92] arXiv:2507.04412 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： SFOOD：一种多模态基准，用于超越RGB的全面食物属性分析，具有光谱见解

标题： SFOOD: A Multimodal Benchmark for Comprehensive Food Attribute Analysis Beyond RGB with Spectral Insights

Zhenbo Xu, Jinghan Yang, Gong Huang, Jiqing Feng, Liu Liu, Ruihan Sun, Ajin Meng, Zhuo Zhang, Zhaofeng He

主题：计算机视觉与模式识别 (cs.CV)
[93] arXiv:2507.04410 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：通过多智能体深度研究多模态大语言模型的多媒体验证

标题： Multimedia Verification Through Multi-Agent Deep Research Multimodal Large Language Models

Huy Hoan Le, Van Sy Thinh Nguyen, Thi Le Chi Dang, Vo Thanh Khang Nguyen, Truong Thanh Hung Nguyen, Hung Cao

评论：第33届ACM国际多媒体会议（MM'25）多媒体验证大型挑战赛

主题：计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI) ; 信息检索 (cs.IR)
[94] arXiv:2507.04409 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： MVNet：基于混合马尔可夫-变压器视觉主干架构的高光谱遥感图像分类

标题： MVNet: Hyperspectral Remote Sensing Image Classification Based on Hybrid Mamba-Transformer Vision Backbone Architecture

Guandong Li, Mengxia Ye

评论：重要：与arXiv:2506.08324、arXiv:2504.15155、arXiv:2504.13045、arXiv:2503.23472存在大量文本重叠

主题：计算机视觉与模式识别 (cs.CV)
[95] arXiv:2507.04408 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：一种用于神经辐射场正则化训练的视图一致采样方法

标题： A View-consistent Sampling Method for Regularized Training of Neural Radiance Fields

Aoxiang Fan, Corentin Dumery, Nicolas Talabot, Pascal Fua

评论： ICCV 2025 被接受

主题：计算机视觉与模式识别 (cs.CV)
[96] arXiv:2507.04403 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： Sat2City：从单个卫星图像生成3D城市与级联潜在扩散

标题： Sat2City: 3D City Generation from A Single Satellite Image with Cascaded Latent Diffusion

Tongyan Hua, Lutao Jiang, Ying-Cong Chen, Wufan Zhao

评论： ICCV 2025

主题：计算机视觉与模式识别 (cs.CV)
[97] arXiv:2507.04397 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： RegistrationMamba：一种基于Mamba的注册框架，结合多专家特征学习用于跨模态遥感图像

标题： RegistrationMamba: A Mamba-based Registration Framework Integrating Multi-Expert Feature Learning for Cross-Modal Remote Sensing Images

Wei Wang, Dou Quan, Chonghua Lv, Shuang Wang, Ning Huyan, Yunan Li, Licheng Jiao

主题：计算机视觉与模式识别 (cs.CV)
[98] arXiv:2507.04388 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：全面的信息瓶颈用于揭示视觉变压器的普遍归因以解释视觉变压器

标题： Comprehensive Information Bottleneck for Unveiling Universal Attribution to Interpret Vision Transformers

Jung-Ho Hong, Ho-Joong Kim, Kyu-Sung Jeon, Seong-Whan Lee

评论： CVPR 2025（亮点）

主题：计算机视觉与模式识别 (cs.CV)
[99] arXiv:2507.04380 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：通过任务算术转移自解释模型的视觉可解释性

标题： Transferring Visual Explainability of Self-Explaining Models through Task Arithmetic

Yuya Yoshikawa, Ryotaro Shimizu, Takahiro Kawashima, Yuki Saito

主题：计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI) ; 机器学习 (cs.LG)
[100] arXiv:2507.04377 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：多模态语义解析用于墓碑铭文的解释

标题： Multi-Modal Semantic Parsing for the Interpretation of Tombstone Inscriptions

Xiao Zhang, Johan Bos

评论：被ACMMM 2025接收

主题：计算机视觉与模式识别 (cs.CV) ; 计算与语言 (cs.CL) ; 多媒体 (cs.MM)

总共 954 条目 : 1-50 51-100 101-150 151-200 201-250 ... 951-954

显示最多 50 每页条目：较少 | 更多 | 所有

计算机视觉与模式识别

最近提交的作者和标题

2025年07月08日， 星期二 (继续， 展示 328 之 50 条目 )

2025年07月08日，星期二 (继续，展示 328 之 50 条目 )