计算机视觉与模式识别

最近提交的作者和标题

查看今天的新的变化

总共 1030 条目 : 1-50 51-100 101-150 151-200 ... 1001-1030

显示最多 50 每页条目：较少 | 更多 | 所有

[1] arXiv:2505.24877 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： AdaHuman：基于组合多视图扩散的可动画详细3D人体生成

标题： AdaHuman: Animatable Detailed 3D Human Generation with Compositional Multiview Diffusion

Yangyi Huang, Ye Yuan, Xueting Li, Jan Kautz, Umar Iqbal

评论：网站: https://nvlabs.github.io/AdaHuman

主题：计算机视觉与模式识别 (cs.CV)
[2] arXiv:2505.24876 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： Agent-X：评估以视觉为中心的能动任务中的深度多模态推理

标题： Agent-X: Evaluating Deep Multimodal Reasoning in Vision-Centric Agentic Tasks

Tajamul Ashraf, Amal Saqib, Hanan Ghani, Muhra AlMahri, Yuhao Li, Noor Ahsan, Umair Nawaz, Jean Lahoud, Hisham Cholakkal, Mubarak Shah, Philip Torr, Fahad Shahbaz Khan, Rao Muhammad Anwer, Salman Khan

主题：计算机视觉与模式识别 (cs.CV) ; 计算与语言 (cs.CL)
[3] arXiv:2505.24875 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： ReasonGen-R1：通过SFT和RL的自回归图像生成模型的CoT

标题： ReasonGen-R1: CoT for Autoregressive Image generation models through SFT and RL

Yu Zhang, Yunqi Li, Yifan Yang, Rui Wang, Yuqing Yang, Dai Qi, Jianmin Bao, Dongdong Chen, Chong Luo, Lili Qiu

主题：计算机视觉与模式识别 (cs.CV) ; 计算与语言 (cs.CL)
[4] arXiv:2505.24873 (交叉列表自 cs.CV) [中文pdf, pdf, 其他]: 标题： MiniMax-Remover：驯服不良噪声有助于视频对象移除

标题： MiniMax-Remover: Taming Bad Noise Helps Video Object Removal

Bojia Zi, Weixuan Peng, Xianbiao Qi, Jianan Wang, Shihao Zhao, Rong Xiao, Kam-Fai Wong

主题：计算机视觉与模式识别 (cs.CV)
[5] arXiv:2505.24872 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： ProxyThinker：通过小型视觉推理器进行测试时指导

标题： ProxyThinker: Test-Time Guidance through Small Visual Reasoners

Zilin Xiao, Jaywon Koo, Siru Ouyang, Jefferson Hernandez, Yu Meng, Vicente Ordonez

主题：计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI) ; 计算与语言 (cs.CL)
[6] arXiv:2505.24871 (交叉列表自 cs.CV) [中文pdf, pdf, 其他]: 标题： MoDoMoDo：多域数据混合物用于多模态大型语言模型强化学习

标题： MoDoMoDo: Multi-Domain Data Mixtures for Multimodal LLM Reinforcement Learning

Yiqing Liang, Jielin Qiu, Wenhao Ding, Zuxin Liu, James Tompkin, Mengdi Xu, Mengzhou Xia, Zhengzhong Tu, Laixi Shi, Jiacheng Zhu

评论：项目主页：https://modomodo-rl.github.io/

主题：计算机视觉与模式识别 (cs.CV) ; 计算与语言 (cs.CL) ; 机器学习 (cs.LG)
[7] arXiv:2505.24870 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： GenSpace：空间感知图像生成的基准测试

标题： GenSpace: Benchmarking Spatially-Aware Image Generation

Zehan Wang, Jiayang Xu, Ziang Zhang, Tianyu Pan, Chao Du, Hengshuang Zhao, Zhou Zhao

主题：计算机视觉与模式识别 (cs.CV)
[8] arXiv:2505.24869 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： SiLVR：一种基于语言的视频推理框架

标题： SiLVR: A Simple Language-based Video Reasoning Framework

Ce Zhang, Yan-Bo Lin, Ziyang Wang, Mohit Bansal, Gedas Bertasius

主题：计算机视觉与模式识别 (cs.CV)
[9] arXiv:2505.24867 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：时间盲点：为什么视频-语言模型看不到人类能看到的东西？

标题： Time Blindness: Why Video-Language Models Can't See What Humans Can?

Ujjwal Upadhyay, Mukul Ranjan, Zhiqiang Shen, Mohamed Elhoseiny

评论：项目页面位于 https://timeblindness.github.io/

主题：计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI)
[10] arXiv:2505.24866 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： TalkingHeadBench：多模态Talking-Head深度伪造检测基准与分析

标题： TalkingHeadBench: A Multi-Modal Benchmark & Analysis of Talking-Head DeepFake Detection

Xinqi Xiong, Prakrut Patel, Qingyuan Fan, Amisha Wadhwa, Sarathy Selvam, Xiao Guo, Luchao Qi, Xiaoming Liu, Roni Sengupta

主题：计算机视觉与模式识别 (cs.CV)
[11] arXiv:2505.24862 (交叉列表自 cs.CV) [中文pdf, pdf, 其他]: 标题： ViStoryBench：故事可视化综合基准套件

标题： ViStoryBench: Comprehensive Benchmark Suite for Story Visualization

Cailin Zhuang, Ailin Huang, Wei Cheng, Jingwei Wu, Yaoqi Hu, Jiaqi Liao, Zhewei Huang, Hongyuan Wang, Xinyao Liao, Weiwei Cai, Hengyuan Xu, Xuanyang Zhang, Xianfang Zeng, Gang Yu, Chi Zhang

评论： 33页，项目页面：https://vistorybench.github.io/，代码：https://github.com/vistorybench/vistorybench

主题：计算机视觉与模式识别 (cs.CV)
[12] arXiv:2505.24848 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：野生环境下的阅读识别

标题： Reading Recognition in the Wild

Charig Yang, Samiul Alam, Shakhrul Iman Siam, Michael J. Proulx, Lambert Mathias, Kiran Somasundaram, Luis Pesqueira, James Fort, Sheroze Sheriffdeen, Omkar Parkhi, Carl Ren, Mi Zhang, Yuning Chai, Richard Newcombe, Hyo Jin Kim

主题：计算机视觉与模式识别 (cs.CV) ; 机器学习 (cs.LG)
[13] arXiv:2505.24840 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：视觉大模型在分层视觉理解方面表现不佳，大模型是瓶颈

标题： Vision LLMs Are Bad at Hierarchical Visual Understanding, and LLMs Are the Bottleneck

Yuwen Tan, Yuan Qing, Boqing Gong

评论： 28页，13幅图

主题：计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI) ; 计算与语言 (cs.CL) ; 机器学习 (cs.LG)
[14] arXiv:2505.24838 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： VideoCAD：用于从 CAD 软件中学习 UI 交互和 3D 推理的大规模视频数据集

标题： VideoCAD: A Large-Scale Video Dataset for Learning UI Interactions and 3D Reasoning from CAD Software

Brandon Man, Ghadi Nehme, Md Ferdous Alam, Faez Ahmed

主题：计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI)
[15] arXiv:2505.24837 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：基于分层多粒度图像-文本对齐的零样本汉字识别

标题： Zero-Shot Chinese Character Recognition with Hierarchical Multi-Granularity Image-Text Aligning

Yinglian Zhu, Haiyang Yu, Qizao Wang, Wei Lu, Xiangyang Xue, Bin Li

评论：前三名作者贡献相同

主题：计算机视觉与模式识别 (cs.CV)
[16] arXiv:2505.24824 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：分割法国的四个世纪

标题： Segmenting France Across Four Centuries

Marta López-Rauhut, Hongyu Zhou, Mathieu Aubry, Loic Landrieu

评论： 20页，8幅图，3张表格

主题：计算机视觉与模式识别 (cs.CV)
[17] arXiv:2505.24816 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： CL-LoRA：无重放类增量学习的连续低秩适应

标题： CL-LoRA: Continual Low-Rank Adaptation for Rehearsal-Free Class-Incremental Learning

Jiangpeng He, Zhihao Duan, Fengqing Zhu

评论：录用为CVPR 2025

主题：计算机视觉与模式识别 (cs.CV)
[18] arXiv:2505.24792 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：面向增强胃肠道疾病分类的任务插值少量网络中的轻量级关系嵌入

标题： Lightweight Relational Embedding in Task-Interpolated Few-Shot Networks for Enhanced Gastrointestinal Disease Classification

Xinliu Zhong, Leo Hwa Liang, Angela S. Koh, Yeo Si Yong

评论： 6页，15幅图

期刊参考： 2024年IEEE人工智能会议（CAI），2024年，第839-844页

主题：计算机视觉与模式识别 (cs.CV)
[19] arXiv:2505.24787 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：绘制你所有的想象：基于复杂指令的图像生成的整体基准和代理框架

标题： Draw ALL Your Imagine: A Holistic Benchmark and Agent Framework for Complex Instruction-based Image Generation

Yucheng Zhou, Jiahao Yuan, Qianning Wang

主题：计算机视觉与模式识别 (cs.CV) ; 计算与语言 (cs.CL)
[20] arXiv:2505.24746 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：解决3D语言高斯点 splatting 中的视点相关语义

标题： Tackling View-Dependent Semantics in 3D Language Gaussian Splatting

Jiazhong Cen, Xudong Zhou, Jiemin Fang, Changsong Wen, Lingxi Xie, Xiaopeng Zhang, Wei Shen, Qi Tian

评论： ICML 2025最终版本。项目页面：https://jumpat.github.io/laga-page/

主题：计算机视觉与模式识别 (cs.CV)
[21] arXiv:2505.24733 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： DreamDance：通过稳定高斯世界修复进行角色艺术动画处理

标题： DreamDance: Animating Character Art via Inpainting Stable Gaussian Worlds

Jiaxu Zhang, Xianfang Zeng, Xin Chen, Wei Zuo, Gang Yu, Guosheng Lin, Zhigang Tu

主题：计算机视觉与模式识别 (cs.CV)
[22] arXiv:2505.24718 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：通过聚焦思考加强视频推理

标题： Reinforcing Video Reasoning with Focused Thinking

Jisheng Dang, Jingze Wu, Teng Wang, Xuanhui Lin, Nannan Zhu, Hongbo Chen, Wei-Shi Zheng, Meng Wang, Tat-Seng Chua

主题：计算机视觉与模式识别 (cs.CV)
[23] arXiv:2505.24705 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： RT-X Net：用于低光照图像增强的RGB-热交叉注意力网络

标题： RT-X Net: RGB-Thermal cross attention network for Low-Light Image Enhancement

Raman Jha, Adithya Lenka, Mani Ramanagopal, Aswin Sankaranarayanan, Kaushik Mitra

评论：已被ICIP 2025接受

主题：计算机视觉与模式识别 (cs.CV)
[24] arXiv:2505.24693 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：一致预测用于零样本模型

标题： Conformal Prediction for Zero-Shot Models

Julio Silva-Rodríguez, Ismail Ben Ayed, Jose Dolz

评论： CVPR 2025. 代码: https://github.com/jusiro/CLIP-Conformal

主题：计算机视觉与模式识别 (cs.CV)
[25] arXiv:2505.24690 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：跨不同第一人称视频理解任务学习可重用的概念

标题： Learning reusable concepts across different egocentric video understanding tasks

Simone Alberto Peirone, Francesca Pistilli, Antonio Alliegro, Tatiana Tommasi, Giuseppe Averta

评论：来自arXiv:2502.02487的扩展摘要。在第二届自中心视觉（EgoVis）研讨会（CVPR 2025）上展示。

主题：计算机视觉与模式识别 (cs.CV)
[26] arXiv:2505.24679 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：超越FACS：数据驱动的面部表情词典，及其在自闭症预测中的应用

标题： Beyond FACS: Data-driven Facial Expression Dictionaries, with Application to Predicting Autism

Evangelos Sariyanidi, Lisa Yankowitz, Robert T. Schultz, John D. Herrington, Birkan Tunc, Jeffrey Cohn

评论：将刊登于《第19届IEEE面部与手势识别国际会议 proceedings》（2025）

主题：计算机视觉与模式识别 (cs.CV)
[27] arXiv:2505.24669 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：通过先验知识集成的点云数据6D位姿估计：自主拆卸中的案例研究

标题： 6D Pose Estimation on Point Cloud Data through Prior Knowledge Integration: A Case Study in Autonomous Disassembly

Chengzhi Wu, Hao Fu, Jan-Philipp Kaiser, Erik Tabuchi Barczak, Julius Pfrommer, Gisela Lanza, Michael Heizmann, Jürgen Beyerer

主题：计算机视觉与模式识别 (cs.CV)
[28] arXiv:2505.24667 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：半监督医学图像分割的解耦竞争框架

标题： Decoupled Competitive Framework for Semi-supervised Medical Image Segmentation

Jiahe Chen, Jiahe Ying, Shen Wang, Jianwei Zheng

评论：发表于ECAI 2024

主题：计算机视觉与模式识别 (cs.CV)
[29] arXiv:2505.24649 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： BIMA：双向最大似然学习方法在大型视觉-语言模型中的幻觉预测与缓解研究

标题： BIMA: Bijective Maximum Likelihood Learning Approach to Hallucination Prediction and Mitigation in Large Vision-Language Models

Huu-Thien Tran, Thanh-Dat Truong, Khoa Luu

评论： CVPRW 2025, 8页, 4幅图

主题：计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI)
[30] arXiv:2505.24641 (交叉列表自 cs.CV) [中文pdf, pdf, 其他]: 标题：一种基于跨分支融合的点云自监督对比学习框架

标题： A Cross Branch Fusion-Based Contrastive Learning Framework for Point Cloud Self-supervised Learning

Chengzhi Wu, Qianliang Huang, Kun Jin, Julius Pfrommer, Jürgen Beyerer

主题：计算机视觉与模式识别 (cs.CV)
[31] arXiv:2505.24638 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：基于角度不变注意力深度学习模型的云光学厚度反演

标题： Cloud Optical Thickness Retrievals Using Angle Invariant Attention Based Deep Learning Models

Zahid Hassan Tushar, Adeleke Ademakinwa, Jianwu Wang, Zhibo Zhang, Sanjay Purushotham

评论： 6页，7幅图，将于2025年IEEE图像处理国际会议（ICIP）上发表。

主题：计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI)
[32] arXiv:2505.24636 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：使用格点变形框架和扩散增强合成数据的农业环境下的类别级6D物体位姿估计

标题： Category-Level 6D Object Pose Estimation in Agricultural Settings Using a Lattice-Deformation Framework and Diffusion-Augmented Synthetic Data

Marios Glytsos, Panagiotis P. Filntisis, George Retsinas, Petros Maragos

评论： 7页，4个图。提交至IEEE/RSJ智能机器人和系统国际会议（IROS）2025。该工作已提交给IEEE以可能出版。

主题：计算机视觉与模式识别 (cs.CV)
[33] arXiv:2505.24634 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： NUC-Net：用于高效LiDAR语义分割的非均匀圆柱分区网络

标题： NUC-Net: Non-uniform Cylindrical Partition Network for Efficient LiDAR Semantic Segmentation

Xuzhi Wang, Wei Feng, Lingdong Kong, Liang Wan

主题：计算机视觉与模式识别 (cs.CV)
[34] arXiv:2505.24625 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：从视频中学习三维世界：利用三维视觉几何先验增强MLLMs

标题： Learning from Videos for 3D World: Enhancing MLLMs with 3D Vision Geometry Priors

Duo Zheng, Shijia Huang, Yanyang Li, Liwei Wang

主题：计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI)
[35] arXiv:2505.24608 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： GARLIC: 高斯表示学习用于空间划分

标题： GARLIC: GAussian Representation LearnIng for spaCe partitioning

Panagiotis Rigas, Panagiotis Drivas, Charalambos Tzamos, Ioannis Chamodrakas, George Ioannakis, Leonidas J. Guibas, Ioannis Z. Emiris

主题：计算机视觉与模式识别 (cs.CV)
[36] arXiv:2505.24600 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： SARD：用于书籍风格文本识别的大规模合成阿拉伯文OCR数据集

标题： SARD: A Large-Scale Synthetic Arabic OCR Dataset for Book-Style Text Recognition

Omer Nacar, Yasser Al-Habashi, Serry Sibaee, Adel Ammar, Wadii Boulila

主题：计算机视觉与模式识别 (cs.CV)
[37] arXiv:2505.24567 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：释放中间域的力量用于混合域半监督医学图像分割

标题： Unleashing the Power of Intermediate Domains for Mixed Domain Semi-Supervised Medical Image Segmentation

Qinghe Ma, Jian Zhang, Lei Qi, Qian Yu, Yinghuan Shi, Yang Gao

评论：已被IEEE TMI 2025接受。arXiv管理员备注：文本与arXiv:2404.08951存在重叠。

主题：计算机视觉与模式识别 (cs.CV)
[38] arXiv:2505.24558 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：加权最优卷积用于分类和去噪

标题： Optimal Weighted Convolution for Classification and Denosing

Simone Cammarasana, Giuseppe Patanè

评论： 17页，3个图，6个表格

主题：计算机视觉与模式识别 (cs.CV)
[39] arXiv:2505.24541 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： Mixpert：通过高效视觉专家混合缓解多模态学习冲突

标题： Mixpert: Mitigating Multimodal Learning Conflicts with Efficient Mixture-of-Vision-Experts

Xin He, Xumeng Han, Longhui Wei, Lingxi Xie, Qi Tian

主题：计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI)
[40] arXiv:2505.24528 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：面向可持续发展目标的地理空间基础模型

标题： Geospatial Foundation Models to Enable Progress on Sustainable Development Goals

Pedram Ghamisi, Weikang Yu, Xiaokang Zhang, Aldino Rizaldy, Jian Wang, Chufeng Zhou, Richard Gloaguen, Gustau Camps-Valls

主题：计算机视觉与模式识别 (cs.CV) ; 机器学习 (cs.LG)
[41] arXiv:2505.24527 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：学习模型中加权卷积的最优密度函数

标题： Optimal Density Functions for Weighted Convolution in Learning Models

Simone Cammarasana, Giuseppe Patanè

评论： 5幅图表，5张表格，21页

主题：计算机视觉与模式识别 (cs.CV) ; 机器学习 (cs.LG)
[42] arXiv:2505.24521 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： UniGeo：用于统一一致几何估计的视频扩散控制

标题： UniGeo: Taming Video Diffusion for Unified Consistent Geometry Estimation

Yang-Tian Sun, Xin Yu, Zehuan Huang, Yi-Hua Huang, Yuan-Chen Guo, Ziyi Yang, Yan-Pei Cao, Xiaojuan Qi

评论：项目页面：https://sunyangtian.github.io/UniGeo-web/

主题：计算机视觉与模式识别 (cs.CV)
[43] arXiv:2505.24519 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： AMIA：自动掩码与联合意图分析使LVLMs成为强大的越狱防御者

标题： AMIA: Automatic Masking and Joint Intention Analysis Makes LVLMs Robust Jailbreak Defenders

Yuqi Zhang, Yuchun Miao, Zuchao Li, Liang Ding

评论： 11页，7幅图

主题：计算机视觉与模式识别 (cs.CV) ; 计算与语言 (cs.CL)
[44] arXiv:2505.24517 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：一个$^2$CLIP：通过反向 unCLIP 提高 CLIP 的视觉细节捕获能力

标题： un$^2$CLIP: Improving CLIP's Visual Detail Capturing Ability via Inverting unCLIP

Yinqi Li, Jiahe Zhao, Hong Chang, Ruibing Hou, Shiguang Shan, Xilin Chen

主题：计算机视觉与模式识别 (cs.CV)
[45] arXiv:2505.24499 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： Reason-SVG：矢量图形生成中的混合奖励强化学习

标题： Reason-SVG: Hybrid Reward RL for Aha-Moments in Vector Graphics Generation

Ximing Xing, Yandong Guan, Jing Zhang, Dong Xu, Qian Yu

评论： 17页，5幅图

主题：计算机视觉与模式识别 (cs.CV)
[46] arXiv:2505.24489 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：应用于遥感目标检测的可变形注意力机制

标题： Deformable Attention Mechanisms Applied to Object Detection, case of Remote Sensing

Anasse Boutayeb, Iyad Lahsen-cherif, Ahmed El Khadimi

评论： 10页，5幅图，论文被第29届国际基于知识和智能信息系统会议（KES 2025）接受，日本大阪

期刊参考：第1版关于地球智能观测与保护的特邀会议，将于2025年在日本大阪举行的第29届知识型和智能信息系统国际会议（KES 2025）同期举办。

主题：计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI)
[47] arXiv:2505.24481 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： ACM-UNet：基于CNN和Mamba自适应融合的高效医学图像分割

标题： ACM-UNet: Adaptive Integration of CNNs and Mamba for Efficient Medical Image Segmentation

Jing Huang, Yongkang Zhao, Yuhan Li, Zhitao Dai, Cheng Chen, Qiying Lai

评论： 10页，3个图，5个表格

主题：计算机视觉与模式识别 (cs.CV)
[48] arXiv:2505.24476 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：周期-LLM：扩展多模态大型语言模型的周期能力

标题： Period-LLM: Extending the Periodic Capability of Multimodal Large Language Model

Yuting Zhang, Hao Lu, Qingyong Hu, Yin Wang, Kaishen Yuan, Xin Liu, Kaishun Wu

评论：已被CVPR 2025接受

主题：计算机视觉与模式识别 (cs.CV)
[49] arXiv:2505.24475 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： SPPSFormer：基于高质量超点的用于点云屋顶平面实例分割的Transformer

标题： SPPSFormer: High-quality Superpoint-based Transformer for Roof Plane Instance Segmentation from Point Clouds

Cheng Zeng, Xiatian Qi, Chi Chen, Kai Sun, Wangle Zhang, Yuxuan Liu, Yan Meng, Bisheng Yang

评论： 18页，8幅图

主题：计算机视觉与模式识别 (cs.CV)
[50] arXiv:2505.24466 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：场景感知重排序的基于文本的人物检索

标题： SA-Person: Text-Based Person Retrieval with Scene-aware Re-ranking

Yingjia Xu, Jinlin Wu, Zhen Chen, Daming Gao, Yang Yang, Zhen Lei, Min Cao

评论： 22页，7幅图。正在审稿中。

主题：计算机视觉与模式识别 (cs.CV)

总共 1030 条目 : 1-50 51-100 101-150 151-200 ... 1001-1030

显示最多 50 每页条目：较少 | 更多 | 所有

计算机视觉与模式识别

最近提交的作者和标题

2025年06月02日， 星期一 (展示 首先 154 之 50 条目 )

2025年06月02日，星期一 (展示首先 154 之 50 条目 )