Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > cs.CV

帮助 | 高级搜索

计算机视觉与模式识别

最近提交的作者和标题

  • 2025年07月08日, 星期二
  • 2025年07月04日, 星期五
  • 2025年07月03日, 星期四
  • 2025年07月02日, 星期三
  • 2025年07月01日, 星期二

查看今天的 新的 变化

总共 954 条目 : 1-50 51-100 101-150 151-200 201-250 ... 951-954
显示最多 50 每页条目: 较少 | 更多 | 所有

2025年07月08日, 星期二 (继续, 展示 328 之 50 条目 )

[51] arXiv:2507.04792 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 基于逐步通道剪枝的模型压缩
标题: Model Compression using Progressive Channel Pruning
Jinyang Guo, Weichen Zhang, Wanli Ouyang, Dong Xu
主题: 计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI)
[52] arXiv:2507.04769 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 从模仿到创新:人工智能独特艺术风格的出现与版权保护的挑战
标题: From Imitation to Innovation: The Emergence of AI Unique Artistic Styles and the Challenge of Copyright Protection
Zexi Jia, Chuanwei Huang, Yeshuang Zhu, Hongyan Fei, Ying Deng, Zhiqiang Yuan, Jiapei Zhang, Jinchao Zhang, Jie Zhou
主题: 计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI)
[53] arXiv:2507.04765 (交叉列表自 cs.CV) [中文pdf, pdf, 其他]
标题: GraphBrep:在图结构中学习B-Rep以实现高效的CAD生成
标题: GraphBrep: Learning B-Rep in Graph Structure for Efficient CAD Generation
Weilin Lai, Tie Xu, Hu Wang
主题: 计算机视觉与模式识别 (cs.CV)
[54] arXiv:2507.04762 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 通过最小二乘多智能体图的目标跟踪增强3D感知
标题: Robustifying 3D Perception through Least-Squares Multi-Agent Graphs Object Tracking
Maria Damanaki, Ioulia Kapsali, Nikos Piperigkos, Alexandros Gkillas, Aris S. Lalos
评论: 6页,3图,4表
主题: 计算机视觉与模式识别 (cs.CV)
[55] arXiv:2507.04750 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: MCFormer:多成本体积网络及粒子图像测速的综合基准
标题: MCFormer: A Multi-Cost-Volume Network and Comprehensive Benchmark for Particle Image Velocimetry
Zicheng Lin (International School, Beijing University of Posts and Telecommunications), Xiaoqiang Li (College of Engineering, Peking University), Yichao Wang (College of Physics and Optoelectronic Engineering, Harbin Engineering University), Chuan Zhu (School of Artificial Intelligence, Beijing University of Posts and Telecommunications)
评论: 20页,13图,5表。对PIV光学流模型的全面基准评估。介绍了MCFormer架构,具有多帧时间处理和多个成本体积。包括基于JHTDB和Blasius CFD模拟的大规模合成PIV数据集。代码和数据集将公开提供
主题: 计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI)
[56] arXiv:2507.04749 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: MatDecompSDF:多视角图像中高保真3D形状和PBR材质分解
标题: MatDecompSDF: High-Fidelity 3D Shape and PBR Material Decomposition from Multi-View Images
Chengyu Wang, Isabella Bennett, Henry Scott, Liang Zhang, Mei Chen, Hao Li, Rui Zhao
评论: 12页,4图
主题: 计算机视觉与模式识别 (cs.CV)
[57] arXiv:2507.04741 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 视觉-语言模型看不到明显的内容
标题: Vision-Language Models Can't See the Obvious
Yasser Dahou, Ngoc Dung Huynh, Phuc H. Le-Khac, Wamiq Reyaz Para, Ankit Singh, Sanath Narayan
主题: 计算机视觉与模式识别 (cs.CV)
[58] arXiv:2507.04735 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 视觉-语言模型在织物检索中的分析
标题: An analysis of vision-language models for fabric retrieval
Francesco Giuliari, Asif Khan Pattan, Mohamed Lamine Mekhalfi, Fabio Poiesi
评论: 已被Ital-IA 2025接收
主题: 计算机视觉与模式识别 (cs.CV)
[59] arXiv:2507.04726 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 失控:通过ControlNet的引导扩散数据中毒攻击
标题: Losing Control: Data Poisoning Attack on Guided Diffusion via ControlNet
Raz Lapid, Almog Dubin
主题: 计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI)
[60] arXiv:2507.04725 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 释放神经坍缩的力量:用于广义类别发现的一致监督-非监督对齐
标题: Unleashing the Power of Neural Collapse: Consistent Supervised-Unsupervised Alignment for Generalized Category Discovery
Jizhou Han, Shaokun Wang, Yuhang He, Chenhao Ding, Qiang Wang, Xinyuan Gao, SongLin Dong, Yihong Gong
主题: 计算机视觉与模式识别 (cs.CV)
[61] arXiv:2507.04710 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 基于人类中心基础模型的几何引导少样本牙科标志点检测
标题: Geometric-Guided Few-Shot Dental Landmark Detection with Human-Centric Foundation Model
Anbang Wang, Marawan Elbatel, Keyuan Liu, Lizhuo Lin, Meng Lan, Yanqi Yang, Xiaomeng Li
评论: MICCAI 2025
主题: 计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI) ; 机器学习 (cs.LG)
[62] arXiv:2507.04705 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 保持身份的文本到视频生成,由简单而有效的时空解耦表示引导
标题: Identity-Preserving Text-to-Video Generation Guided by Simple yet Effective Spatial-Temporal Decoupled Representations
Yuji Wang, Moran Li, Xiaobin Hu, Ran Yi, Jiangning Zhang, Han Feng, Weijian Cao, Yabiao Wang, Chengjie Wang, Lizhuang Ma
主题: 计算机视觉与模式识别 (cs.CV)
[63] arXiv:2507.04702 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: Tempo-R0:通过高效时间感知强化学习进行时间视频定位的视频-MLLM
标题: Tempo-R0: A Video-MLLM for Temporal Video Grounding through Efficient Temporal Sensing Reinforcement Learning
Feng Yue, Zhaoxing Zhang, Junming Jiao, Zhengyu Liang, Shiwen Cao, Feifei Zhang, Rong Shen
主题: 计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI)
[64] arXiv:2507.04699 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 通过生成反事实集合在CLIP组合性推理中的视觉飞跃
标题: A Visual Leap in CLIP Compositionality Reasoning through Generation of Counterfactual Sets
Zexi Jia, Chuanwei Huang, Hongyan Fei, Yeshuang Zhu, Zhiqiang Yuan, Ying Deng, Jiapei Zhang, Jinchao Zhang, Jie Zhou
主题: 计算机视觉与模式识别 (cs.CV)
[65] arXiv:2507.04692 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 基于结构引导的扩散模型用于高保真人像阴影去除
标题: Structure-Guided Diffusion Models for High-Fidelity Portrait Shadow Removal
Wanchang Yu, Qing Zhang, Rongjia Zheng, Wei-Shi Zheng
主题: 计算机视觉与模式识别 (cs.CV)
[66] arXiv:2507.04685 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 牙齿生成器:成对正畸前和正畸后三维牙科数据生成的两阶段框架
标题: TeethGenerator: A two-stage framework for paired pre- and post-orthodontic 3D dental data generation
Changsong Lei, Yaqian Liang, Shaofeng Wang, Jiajia Dai, Yong-Jin Liu
评论: 被ICCV 2025接收
主题: 计算机视觉与模式识别 (cs.CV)
[67] arXiv:2507.04681 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 结直肠癌肿瘤分级分割在数字病理学图像中:从大到小的挑战
标题: Colorectal Cancer Tumor Grade Segmentation in Digital Histopathology Images: From Giga to Mini Challenge
Alper Bahcekapili, Duygu Arslan, Umut Ozdemir, Berkay Ozkirli, Emre Akbas, Ahmet Acar, Gozde B. Akar, Bingdou He, Shuoyu Xu, Umit Mert Caglar, Alptekin Temizel, Guillaume Picaud, Marc Chaumont, Gérard Subsol, Luc Téot, Fahad Alsharekh, Shahad Alghannam, Hexiang Mao, Wenhua Zhang
评论: 接受的主旨演讲论文 ICIP 2025
主题: 计算机视觉与模式识别 (cs.CV)
[68] arXiv:2507.04678 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: ChangeBridge:多模态控制的时空图像生成用于遥感
标题: ChangeBridge: Spatiotemporal Image Generation with Multimodal Controls for Remote Sensing
Zhenghui Zhao, Chen Wu, Di Wang, Hongruixuan Chen, Zhuo Zheng
主题: 计算机视觉与模式识别 (cs.CV)
[69] arXiv:2507.04667 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 现在是什么在发出声音? 以视频为中心的音视频定位
标题: What's Making That Sound Right Now? Video-centric Audio-Visual Localization
Hahyeon Choi, Junhoo Lee, Nojun Kwak
评论: 发表于ICCV 2025。项目页面:https://hahyeon610.github.io/Video-centric_Audio_Visual_Localization/
主题: 计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI) ; 多媒体 (cs.MM) ; 声音 (cs.SD) ; 音频与语音处理 (eess.AS)
[70] arXiv:2507.04664 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: VectorLLM:通过多模态大语言模型实现结构化建筑轮廓的人类似提取
标题: VectorLLM: Human-like Extraction of Structured Building Contours vis Multimodal LLMs
Tao Zhang, Shiqing Wei, Shihao Chen, Wenling Yu, Muying Luo, Shunping Ji
主题: 计算机视觉与模式识别 (cs.CV)
[71] arXiv:2507.04638 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: UGG-ReID:基于不确定性引导的图模型的多模态目标重识别
标题: UGG-ReID: Uncertainty-Guided Graph Model for Multi-Modal Object Re-Identification
Xixi Wan, Aihua Zheng, Bo Jiang, Beibei Wang, Chenglong Li, Jin Tang
主题: 计算机视觉与模式识别 (cs.CV)
[72] arXiv:2507.04635 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: MODA:多模态感知、认知和情感理解的模块化双工注意力
标题: MODA: MOdular Duplex Attention for Multimodal Perception, Cognition, and Emotion Understanding
Zhicheng Zhang, Wuyou Xia, Chenxi Zhao, Zhou Yan, Xiaoqiang Liu, Yongjie Zhu, Wenyu Qin, Pengfei Wan, Di Zhang, Jufeng Yang
评论: ICML 2025(亮点论文,前2.6%)
主题: 计算机视觉与模式识别 (cs.CV)
[73] arXiv:2507.04634 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: LTMSformer:一种用于多智能体轨迹预测的局部趋势感知注意力和运动状态编码变压器
标题: LTMSformer: A Local Trend-Aware Attention and Motion State Encoding Transformer for Multi-Agent Trajectory Prediction
Yixin Yan, Yang Li, Yuanfan Wang, Xiaozhou Zhou, Beihao Xia, Manjiang Hu, Hongmao Qin
主题: 计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI)
[74] arXiv:2507.04631 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 在野外使用选择性专家混合进行鲁棒立体匹配学习
标题: Learning Robust Stereo Matching in the Wild with Selective Mixture-of-Experts
Yun Wang, Longguang Wang, Chenghao Zhang, Yongjian Zhang, Zhanjie Zhang, Ao Ma, Chenyou Fan, Tin Lun Lam, Junjie Hu
期刊参考: ICCV 2025
主题: 计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI) ; 机器人技术 (cs.RO)
[75] arXiv:2507.04630 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 通过主动选择和重新标注更好地学习3D VQA
标题: Learn 3D VQA Better with Active Selection and Reannotation
Shengli Zhou, Yang Liu, Feng Zheng
评论: 被ACM MM 2025接受
主题: 计算机视觉与模式识别 (cs.CV)
[76] arXiv:2507.04613 (交叉列表自 cs.CV) [中文pdf, pdf, 其他]
标题: HiLa:用于癌症生存预测的分层视觉-语言协作
标题: HiLa: Hierarchical Vision-Language Collaboration for Cancer Survival Prediction
Jiaqi Cui, Lu Wen, Yuchen Fei, Bo Liu, Luping Zhou, Dinggang Shen, Yan Wang
评论: 被MICCAI 2025接受
主题: 计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI)
[77] arXiv:2507.04599 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: QR-LoRA:通过QR分解进行高效且解耦的微调以实现定制生成
标题: QR-LoRA: Efficient and Disentangled Fine-tuning via QR Decomposition for Customized Generation
Jiahui Yang, Yongjia Ma, Donglin Di, Hao Li, Wei Chen, Yan Xie, Jianxun Cui, Xun Yang, Wangmeng Zuo
评论: ICCV 2025,30页,26图
主题: 计算机视觉与模式识别 (cs.CV)
[78] arXiv:2507.04590 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: VLM2Vec-V2:推动视频、图像和视觉文档的多模态嵌入
标题: VLM2Vec-V2: Advancing Multimodal Embedding for Videos, Images, and Visual Documents
Rui Meng, Ziyan Jiang, Ye Liu, Mingyi Su, Xinyi Yang, Yuepeng Fu, Can Qin, Zeyuan Chen, Ran Xu, Caiming Xiong, Yingbo Zhou, Wenhu Chen, Semih Yavuz
评论: 技术报告
主题: 计算机视觉与模式识别 (cs.CV) ; 计算与语言 (cs.CL)
[79] arXiv:2507.04587 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: CVFusion:4D雷达与相机的跨视图融合用于3D目标检测
标题: CVFusion: Cross-View Fusion of 4D Radar and Camera for 3D Object Detection
Hanzhi Zhong, Zhiyu Xiang, Ruoyu Xu, Jingyun Fu, Peng Xu, Shaohong Wang, Zhihao Yang, Tianyu Pu, Eryun Liu
主题: 计算机视觉与模式识别 (cs.CV)
[80] arXiv:2507.04584 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: S$^2$编辑:具有精确语义和空间控制的文本引导图像编辑
标题: S$^2$Edit: Text-Guided Image Editing with Precise Semantic and Spatial Control
Xudong Liu, Zikun Chen, Ruowei Jiang, Ziyi Wu, Kejia Yin, Han Zhao, Parham Aarabi, Igor Gilitschenski
主题: 计算机视觉与模式识别 (cs.CV)
[81] arXiv:2507.04559 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: MambaVideo 用于具有通道分割量化的离散视频标记化
标题: MambaVideo for Discrete Video Tokenization with Channel-Split Quantization
Dawit Mureja Argaw, Xian Liu, Joon Son Chung, Ming-Yu Liu, Fitsum Reda
评论: 项目网站:https://research.nvidia.com/labs/dir/mamba-tokenizer/
主题: 计算机视觉与模式识别 (cs.CV)
[82] arXiv:2507.04529 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 一种用于多样化车载数据记录的数据驱动新颖性评分
标题: A Data-Driven Novelty Score for Diverse In-Vehicle Data Recording
Philipp Reis, Joshua Ransiek, David Petri, Jacob Langner, Eric Sax
评论: 8页,被IEEE ITSC 2025接收
主题: 计算机视觉与模式识别 (cs.CV)
[83] arXiv:2507.04522 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 基于地面的手势生成:语言、运动和空间
标题: Grounded Gesture Generation: Language, Motion, and Space
Anna Deichler, Jim O'Regan, Teo Guichoux, David Johansson, Jonas Beskow
评论: 被接受为CVPR 2025仿人智能体研讨会的非档案论文。项目页面:https://groundedgestures.github.io
主题: 计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI) ; 机器人技术 (cs.RO)
[84] arXiv:2507.04511 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: FA:用于分布外检测的视觉-语言模型强制提示学习
标题: FA: Forced Prompt Learning of Vision-Language Models for Out-of-Distribution Detection
Xinhua Lu, Runhe Lai, Yanqi Wu, Kanghao Chen, Wei-Shi Zheng, Ruixuan Wang
主题: 计算机视觉与模式识别 (cs.CV)
[85] arXiv:2507.04509 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: MVL-Loc:利用视觉语言模型进行可泛化的多场景相机重新定位
标题: MVL-Loc: Leveraging Vision-Language Model for Generalizable Multi-Scene Camera Relocalization
Zhendong Xiao, Wu Wei, Shujie Ji, Shan Yang, Changhao Chen
评论: 模式识别与计算机视觉
主题: 计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI)
[86] arXiv:2507.04503 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: U-ViLAR:通过可微关联和配准的不确定性感知自主驾驶视觉定位
标题: U-ViLAR: Uncertainty-Aware Visual Localization for Autonomous Driving via Differentiable Association and Registration
Xiaofan Li, Zhihao Xu, Chenming Wu, Zhao Yang, Yumeng Zhang, Jiang-Jiang Liu, Haibao Yu, Fan Duan, Xiaoqing Ye, Yuan Wang, Shirui Li, Xun Sun, Ji Wan, Jun Wang
评论: 视觉定位,自动驾驶,鸟瞰图
主题: 计算机视觉与模式识别 (cs.CV) ; 机器人技术 (cs.RO)
[87] arXiv:2507.04482 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 一种无需训练的尺度自回归模型风格个性化
标题: A Training-Free Style-Personalization via Scale-wise Autoregressive Model
Kyoungmin Lee, Jihun Park, Jongmin Gim, Wonhyeok Choi, Kyumin Hwang, Jaeyeul Kim, Sunghoon Im
评论: 13页,10图
主题: 计算机视觉与模式识别 (cs.CV)
[88] arXiv:2507.04465 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 基于深度学习的视觉手部手势识别:方法、数据集、挑战与未来研究方向的全面综述
标题: Visual Hand Gesture Recognition with Deep Learning: A Comprehensive Review of Methods, Datasets, Challenges and Future Research Directions
Konstantinos Foteinos, Jorgen Cani, Manousos Linardakis, Panagiotis Radoglou-Grammatikis, Vasileios Argyriou, Panagiotis Sarigiannidis, Iraklis Varlamis, Georgios Th. Papadopoulos
主题: 计算机视觉与模式识别 (cs.CV)
[89] arXiv:2507.04456 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: BiVM:用于高效视频抠图的精确二值化神经网络
标题: BiVM: Accurate Binarized Neural Network for Efficient Video Matting
Haotong Qin, Xianglong Liu, Xudong Ma, Lei Ke, Yulun Zhang, Jie Luo, Michele Magno
主题: 计算机视觉与模式识别 (cs.CV)
[90] arXiv:2507.04451 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: CoT-增强的扩散:让我们逐步强化文本到图像生成
标题: CoT-lized Diffusion: Let's Reinforce T2I Generation Step-by-step
Zheyuan Liu, Munan Ning, Qihui Zhang, Shuo Yang, Zhongrui Wang, Yiwei Yang, Xianzhe Xu, Yibing Song, Weihua Chen, Fan Wang, Li Yuan
主题: 计算机视觉与模式识别 (cs.CV)
[91] arXiv:2507.04447 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: DreamVLA:一个融合全面世界知识的视觉-语言-动作模型
标题: DreamVLA: A Vision-Language-Action Model Dreamed with Comprehensive World Knowledge
Wenyao Zhang, Hongsi Liu, Zekun Qi, Yunnan Wang, XinQiang Yu, Jiazhao Zhang, Runpei Dong, Jiawei He, He Wang, Zhizheng Zhang, Li Yi, Wenjun Zeng, Xin Jin
主题: 计算机视觉与模式识别 (cs.CV) ; 机器人技术 (cs.RO)
[92] arXiv:2507.04412 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: SFOOD:一种多模态基准,用于超越RGB的全面食物属性分析,具有光谱见解
标题: SFOOD: A Multimodal Benchmark for Comprehensive Food Attribute Analysis Beyond RGB with Spectral Insights
Zhenbo Xu, Jinghan Yang, Gong Huang, Jiqing Feng, Liu Liu, Ruihan Sun, Ajin Meng, Zhuo Zhang, Zhaofeng He
主题: 计算机视觉与模式识别 (cs.CV)
[93] arXiv:2507.04410 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 通过多智能体深度研究多模态大语言模型的多媒体验证
标题: Multimedia Verification Through Multi-Agent Deep Research Multimodal Large Language Models
Huy Hoan Le, Van Sy Thinh Nguyen, Thi Le Chi Dang, Vo Thanh Khang Nguyen, Truong Thanh Hung Nguyen, Hung Cao
评论: 第33届ACM国际多媒体会议(MM'25)多媒体验证大型挑战赛
主题: 计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI) ; 信息检索 (cs.IR)
[94] arXiv:2507.04409 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: MVNet:基于混合马尔可夫-变压器视觉主干架构的高光谱遥感图像分类
标题: MVNet: Hyperspectral Remote Sensing Image Classification Based on Hybrid Mamba-Transformer Vision Backbone Architecture
Guandong Li, Mengxia Ye
评论: 重要:与arXiv:2506.08324、arXiv:2504.15155、arXiv:2504.13045、arXiv:2503.23472存在大量文本重叠
主题: 计算机视觉与模式识别 (cs.CV)
[95] arXiv:2507.04408 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 一种用于神经辐射场正则化训练的视图一致采样方法
标题: A View-consistent Sampling Method for Regularized Training of Neural Radiance Fields
Aoxiang Fan, Corentin Dumery, Nicolas Talabot, Pascal Fua
评论: ICCV 2025 被接受
主题: 计算机视觉与模式识别 (cs.CV)
[96] arXiv:2507.04403 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: Sat2City:从单个卫星图像生成3D城市与级联潜在扩散
标题: Sat2City: 3D City Generation from A Single Satellite Image with Cascaded Latent Diffusion
Tongyan Hua, Lutao Jiang, Ying-Cong Chen, Wufan Zhao
评论: ICCV 2025
主题: 计算机视觉与模式识别 (cs.CV)
[97] arXiv:2507.04397 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: RegistrationMamba:一种基于Mamba的注册框架,结合多专家特征学习用于跨模态遥感图像
标题: RegistrationMamba: A Mamba-based Registration Framework Integrating Multi-Expert Feature Learning for Cross-Modal Remote Sensing Images
Wei Wang, Dou Quan, Chonghua Lv, Shuang Wang, Ning Huyan, Yunan Li, Licheng Jiao
主题: 计算机视觉与模式识别 (cs.CV)
[98] arXiv:2507.04388 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 全面的信息瓶颈用于揭示视觉变压器的普遍归因以解释视觉变压器
标题: Comprehensive Information Bottleneck for Unveiling Universal Attribution to Interpret Vision Transformers
Jung-Ho Hong, Ho-Joong Kim, Kyu-Sung Jeon, Seong-Whan Lee
评论: CVPR 2025(亮点)
主题: 计算机视觉与模式识别 (cs.CV)
[99] arXiv:2507.04380 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 通过任务算术转移自解释模型的视觉可解释性
标题: Transferring Visual Explainability of Self-Explaining Models through Task Arithmetic
Yuya Yoshikawa, Ryotaro Shimizu, Takahiro Kawashima, Yuki Saito
主题: 计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI) ; 机器学习 (cs.LG)
[100] arXiv:2507.04377 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 多模态语义解析用于墓碑铭文的解释
标题: Multi-Modal Semantic Parsing for the Interpretation of Tombstone Inscriptions
Xiao Zhang, Johan Bos
评论: 被ACMMM 2025接收
主题: 计算机视觉与模式识别 (cs.CV) ; 计算与语言 (cs.CL) ; 多媒体 (cs.MM)
总共 954 条目 : 1-50 51-100 101-150 151-200 201-250 ... 951-954
显示最多 50 每页条目: 较少 | 更多 | 所有
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号