Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > cs.CV

帮助 | 高级搜索

计算机视觉与模式识别

最近提交的作者和标题

  • 2025年06月02日, 星期一
  • 2025年05月30日, 星期五
  • 2025年05月29日, 星期四
  • 2025年05月28日, 星期三
  • 2025年05月27日, 星期二

查看今天的 新的 变化

总共 1030 条目 : 1-50 51-100 101-150 151-200 ... 1001-1030
显示最多 50 每页条目: 较少 | 更多 | 所有

2025年06月02日, 星期一 (展示 首先 154 之 50 条目 )

[1] arXiv:2505.24877 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: AdaHuman:基于组合多视图扩散的可动画详细3D人体生成
标题: AdaHuman: Animatable Detailed 3D Human Generation with Compositional Multiview Diffusion
Yangyi Huang, Ye Yuan, Xueting Li, Jan Kautz, Umar Iqbal
评论: 网站: https://nvlabs.github.io/AdaHuman
主题: 计算机视觉与模式识别 (cs.CV)
[2] arXiv:2505.24876 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: Agent-X:评估以视觉为中心的能动任务中的深度多模态推理
标题: Agent-X: Evaluating Deep Multimodal Reasoning in Vision-Centric Agentic Tasks
Tajamul Ashraf, Amal Saqib, Hanan Ghani, Muhra AlMahri, Yuhao Li, Noor Ahsan, Umair Nawaz, Jean Lahoud, Hisham Cholakkal, Mubarak Shah, Philip Torr, Fahad Shahbaz Khan, Rao Muhammad Anwer, Salman Khan
主题: 计算机视觉与模式识别 (cs.CV) ; 计算与语言 (cs.CL)
[3] arXiv:2505.24875 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: ReasonGen-R1:通过SFT和RL的自回归图像生成模型的CoT
标题: ReasonGen-R1: CoT for Autoregressive Image generation models through SFT and RL
Yu Zhang, Yunqi Li, Yifan Yang, Rui Wang, Yuqing Yang, Dai Qi, Jianmin Bao, Dongdong Chen, Chong Luo, Lili Qiu
主题: 计算机视觉与模式识别 (cs.CV) ; 计算与语言 (cs.CL)
[4] arXiv:2505.24873 (交叉列表自 cs.CV) [中文pdf, pdf, 其他]
标题: MiniMax-Remover:驯服不良噪声有助于视频对象移除
标题: MiniMax-Remover: Taming Bad Noise Helps Video Object Removal
Bojia Zi, Weixuan Peng, Xianbiao Qi, Jianan Wang, Shihao Zhao, Rong Xiao, Kam-Fai Wong
主题: 计算机视觉与模式识别 (cs.CV)
[5] arXiv:2505.24872 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: ProxyThinker:通过小型视觉推理器进行测试时指导
标题: ProxyThinker: Test-Time Guidance through Small Visual Reasoners
Zilin Xiao, Jaywon Koo, Siru Ouyang, Jefferson Hernandez, Yu Meng, Vicente Ordonez
主题: 计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI) ; 计算与语言 (cs.CL)
[6] arXiv:2505.24871 (交叉列表自 cs.CV) [中文pdf, pdf, 其他]
标题: MoDoMoDo:多域数据混合物用于多模态大型语言模型强化学习
标题: MoDoMoDo: Multi-Domain Data Mixtures for Multimodal LLM Reinforcement Learning
Yiqing Liang, Jielin Qiu, Wenhao Ding, Zuxin Liu, James Tompkin, Mengdi Xu, Mengzhou Xia, Zhengzhong Tu, Laixi Shi, Jiacheng Zhu
评论: 项目主页:https://modomodo-rl.github.io/
主题: 计算机视觉与模式识别 (cs.CV) ; 计算与语言 (cs.CL) ; 机器学习 (cs.LG)
[7] arXiv:2505.24870 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: GenSpace:空间感知图像生成的基准测试
标题: GenSpace: Benchmarking Spatially-Aware Image Generation
Zehan Wang, Jiayang Xu, Ziang Zhang, Tianyu Pan, Chao Du, Hengshuang Zhao, Zhou Zhao
主题: 计算机视觉与模式识别 (cs.CV)
[8] arXiv:2505.24869 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: SiLVR:一种基于语言的视频推理框架
标题: SiLVR: A Simple Language-based Video Reasoning Framework
Ce Zhang, Yan-Bo Lin, Ziyang Wang, Mohit Bansal, Gedas Bertasius
主题: 计算机视觉与模式识别 (cs.CV)
[9] arXiv:2505.24867 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 时间盲点:为什么视频-语言模型看不到人类能看到的东西?
标题: Time Blindness: Why Video-Language Models Can't See What Humans Can?
Ujjwal Upadhyay, Mukul Ranjan, Zhiqiang Shen, Mohamed Elhoseiny
评论: 项目页面位于 https://timeblindness.github.io/
主题: 计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI)
[10] arXiv:2505.24866 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: TalkingHeadBench:多模态Talking-Head深度伪造检测基准与分析
标题: TalkingHeadBench: A Multi-Modal Benchmark & Analysis of Talking-Head DeepFake Detection
Xinqi Xiong, Prakrut Patel, Qingyuan Fan, Amisha Wadhwa, Sarathy Selvam, Xiao Guo, Luchao Qi, Xiaoming Liu, Roni Sengupta
主题: 计算机视觉与模式识别 (cs.CV)
[11] arXiv:2505.24862 (交叉列表自 cs.CV) [中文pdf, pdf, 其他]
标题: ViStoryBench:故事可视化综合基准套件
标题: ViStoryBench: Comprehensive Benchmark Suite for Story Visualization
Cailin Zhuang, Ailin Huang, Wei Cheng, Jingwei Wu, Yaoqi Hu, Jiaqi Liao, Zhewei Huang, Hongyuan Wang, Xinyao Liao, Weiwei Cai, Hengyuan Xu, Xuanyang Zhang, Xianfang Zeng, Gang Yu, Chi Zhang
评论: 33页,项目页面:https://vistorybench.github.io/,代码:https://github.com/vistorybench/vistorybench
主题: 计算机视觉与模式识别 (cs.CV)
[12] arXiv:2505.24848 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 野生环境下的阅读识别
标题: Reading Recognition in the Wild
Charig Yang, Samiul Alam, Shakhrul Iman Siam, Michael J. Proulx, Lambert Mathias, Kiran Somasundaram, Luis Pesqueira, James Fort, Sheroze Sheriffdeen, Omkar Parkhi, Carl Ren, Mi Zhang, Yuning Chai, Richard Newcombe, Hyo Jin Kim
主题: 计算机视觉与模式识别 (cs.CV) ; 机器学习 (cs.LG)
[13] arXiv:2505.24840 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 视觉大模型在分层视觉理解方面表现不佳,大模型是瓶颈
标题: Vision LLMs Are Bad at Hierarchical Visual Understanding, and LLMs Are the Bottleneck
Yuwen Tan, Yuan Qing, Boqing Gong
评论: 28页,13幅图
主题: 计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI) ; 计算与语言 (cs.CL) ; 机器学习 (cs.LG)
[14] arXiv:2505.24838 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: VideoCAD:用于从 CAD 软件中学习 UI 交互和 3D 推理的大规模视频数据集
标题: VideoCAD: A Large-Scale Video Dataset for Learning UI Interactions and 3D Reasoning from CAD Software
Brandon Man, Ghadi Nehme, Md Ferdous Alam, Faez Ahmed
主题: 计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI)
[15] arXiv:2505.24837 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 基于分层多粒度图像-文本对齐的零样本汉字识别
标题: Zero-Shot Chinese Character Recognition with Hierarchical Multi-Granularity Image-Text Aligning
Yinglian Zhu, Haiyang Yu, Qizao Wang, Wei Lu, Xiangyang Xue, Bin Li
评论: 前三名作者贡献相同
主题: 计算机视觉与模式识别 (cs.CV)
[16] arXiv:2505.24824 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 分割法国的四个世纪
标题: Segmenting France Across Four Centuries
Marta López-Rauhut, Hongyu Zhou, Mathieu Aubry, Loic Landrieu
评论: 20页,8幅图,3张表格
主题: 计算机视觉与模式识别 (cs.CV)
[17] arXiv:2505.24816 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: CL-LoRA:无重放类增量学习的连续低秩适应
标题: CL-LoRA: Continual Low-Rank Adaptation for Rehearsal-Free Class-Incremental Learning
Jiangpeng He, Zhihao Duan, Fengqing Zhu
评论: 录用为CVPR 2025
主题: 计算机视觉与模式识别 (cs.CV)
[18] arXiv:2505.24792 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 面向增强胃肠道疾病分类的任务插值少量网络中的轻量级关系嵌入
标题: Lightweight Relational Embedding in Task-Interpolated Few-Shot Networks for Enhanced Gastrointestinal Disease Classification
Xinliu Zhong, Leo Hwa Liang, Angela S. Koh, Yeo Si Yong
评论: 6页,15幅图
期刊参考: 2024年IEEE人工智能会议(CAI),2024年,第839-844页
主题: 计算机视觉与模式识别 (cs.CV)
[19] arXiv:2505.24787 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 绘制你所有的想象:基于复杂指令的图像生成的整体基准和代理框架
标题: Draw ALL Your Imagine: A Holistic Benchmark and Agent Framework for Complex Instruction-based Image Generation
Yucheng Zhou, Jiahao Yuan, Qianning Wang
主题: 计算机视觉与模式识别 (cs.CV) ; 计算与语言 (cs.CL)
[20] arXiv:2505.24746 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 解决3D语言高斯点 splatting 中的视点相关语义
标题: Tackling View-Dependent Semantics in 3D Language Gaussian Splatting
Jiazhong Cen, Xudong Zhou, Jiemin Fang, Changsong Wen, Lingxi Xie, Xiaopeng Zhang, Wei Shen, Qi Tian
评论: ICML 2025最终版本。项目页面:https://jumpat.github.io/laga-page/
主题: 计算机视觉与模式识别 (cs.CV)
[21] arXiv:2505.24733 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: DreamDance:通过稳定高斯世界修复进行角色艺术动画处理
标题: DreamDance: Animating Character Art via Inpainting Stable Gaussian Worlds
Jiaxu Zhang, Xianfang Zeng, Xin Chen, Wei Zuo, Gang Yu, Guosheng Lin, Zhigang Tu
主题: 计算机视觉与模式识别 (cs.CV)
[22] arXiv:2505.24718 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 通过聚焦思考加强视频推理
标题: Reinforcing Video Reasoning with Focused Thinking
Jisheng Dang, Jingze Wu, Teng Wang, Xuanhui Lin, Nannan Zhu, Hongbo Chen, Wei-Shi Zheng, Meng Wang, Tat-Seng Chua
主题: 计算机视觉与模式识别 (cs.CV)
[23] arXiv:2505.24705 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: RT-X Net:用于低光照图像增强的RGB-热交叉注意力网络
标题: RT-X Net: RGB-Thermal cross attention network for Low-Light Image Enhancement
Raman Jha, Adithya Lenka, Mani Ramanagopal, Aswin Sankaranarayanan, Kaushik Mitra
评论: 已被ICIP 2025接受
主题: 计算机视觉与模式识别 (cs.CV)
[24] arXiv:2505.24693 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 一致预测用于零样本模型
标题: Conformal Prediction for Zero-Shot Models
Julio Silva-Rodríguez, Ismail Ben Ayed, Jose Dolz
评论: CVPR 2025. 代码: https://github.com/jusiro/CLIP-Conformal
主题: 计算机视觉与模式识别 (cs.CV)
[25] arXiv:2505.24690 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 跨不同第一人称视频理解任务学习可重用的概念
标题: Learning reusable concepts across different egocentric video understanding tasks
Simone Alberto Peirone, Francesca Pistilli, Antonio Alliegro, Tatiana Tommasi, Giuseppe Averta
评论: 来自arXiv:2502.02487的扩展摘要。在第二届自中心视觉(EgoVis)研讨会(CVPR 2025)上展示。
主题: 计算机视觉与模式识别 (cs.CV)
[26] arXiv:2505.24679 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 超越FACS:数据驱动的面部表情词典,及其在自闭症预测中的应用
标题: Beyond FACS: Data-driven Facial Expression Dictionaries, with Application to Predicting Autism
Evangelos Sariyanidi, Lisa Yankowitz, Robert T. Schultz, John D. Herrington, Birkan Tunc, Jeffrey Cohn
评论: 将刊登于《第19届IEEE面部与手势识别国际会议 proceedings》(2025)
主题: 计算机视觉与模式识别 (cs.CV)
[27] arXiv:2505.24669 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 通过先验知识集成的点云数据6D位姿估计:自主拆卸中的案例研究
标题: 6D Pose Estimation on Point Cloud Data through Prior Knowledge Integration: A Case Study in Autonomous Disassembly
Chengzhi Wu, Hao Fu, Jan-Philipp Kaiser, Erik Tabuchi Barczak, Julius Pfrommer, Gisela Lanza, Michael Heizmann, Jürgen Beyerer
主题: 计算机视觉与模式识别 (cs.CV)
[28] arXiv:2505.24667 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 半监督医学图像分割的解耦竞争框架
标题: Decoupled Competitive Framework for Semi-supervised Medical Image Segmentation
Jiahe Chen, Jiahe Ying, Shen Wang, Jianwei Zheng
评论: 发表于ECAI 2024
主题: 计算机视觉与模式识别 (cs.CV)
[29] arXiv:2505.24649 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: BIMA:双向最大似然学习方法在大型视觉-语言模型中的幻觉预测与缓解研究
标题: BIMA: Bijective Maximum Likelihood Learning Approach to Hallucination Prediction and Mitigation in Large Vision-Language Models
Huu-Thien Tran, Thanh-Dat Truong, Khoa Luu
评论: CVPRW 2025, 8页, 4幅图
主题: 计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI)
[30] arXiv:2505.24641 (交叉列表自 cs.CV) [中文pdf, pdf, 其他]
标题: 一种基于跨分支融合的点云自监督对比学习框架
标题: A Cross Branch Fusion-Based Contrastive Learning Framework for Point Cloud Self-supervised Learning
Chengzhi Wu, Qianliang Huang, Kun Jin, Julius Pfrommer, Jürgen Beyerer
主题: 计算机视觉与模式识别 (cs.CV)
[31] arXiv:2505.24638 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 基于角度不变注意力深度学习模型的云光学厚度反演
标题: Cloud Optical Thickness Retrievals Using Angle Invariant Attention Based Deep Learning Models
Zahid Hassan Tushar, Adeleke Ademakinwa, Jianwu Wang, Zhibo Zhang, Sanjay Purushotham
评论: 6页,7幅图,将于2025年IEEE图像处理国际会议(ICIP)上发表。
主题: 计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI)
[32] arXiv:2505.24636 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 使用格点变形框架和扩散增强合成数据的农业环境下的类别级6D物体位姿估计
标题: Category-Level 6D Object Pose Estimation in Agricultural Settings Using a Lattice-Deformation Framework and Diffusion-Augmented Synthetic Data
Marios Glytsos, Panagiotis P. Filntisis, George Retsinas, Petros Maragos
评论: 7页,4个图。提交至IEEE/RSJ智能机器人和系统国际会议(IROS)2025。该工作已提交给IEEE以可能出版。
主题: 计算机视觉与模式识别 (cs.CV)
[33] arXiv:2505.24634 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: NUC-Net:用于高效LiDAR语义分割的非均匀圆柱分区网络
标题: NUC-Net: Non-uniform Cylindrical Partition Network for Efficient LiDAR Semantic Segmentation
Xuzhi Wang, Wei Feng, Lingdong Kong, Liang Wan
主题: 计算机视觉与模式识别 (cs.CV)
[34] arXiv:2505.24625 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 从视频中学习三维世界:利用三维视觉几何先验增强MLLMs
标题: Learning from Videos for 3D World: Enhancing MLLMs with 3D Vision Geometry Priors
Duo Zheng, Shijia Huang, Yanyang Li, Liwei Wang
主题: 计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI)
[35] arXiv:2505.24608 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: GARLIC: 高斯表示学习用于空间划分
标题: GARLIC: GAussian Representation LearnIng for spaCe partitioning
Panagiotis Rigas, Panagiotis Drivas, Charalambos Tzamos, Ioannis Chamodrakas, George Ioannakis, Leonidas J. Guibas, Ioannis Z. Emiris
主题: 计算机视觉与模式识别 (cs.CV)
[36] arXiv:2505.24600 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: SARD:用于书籍风格文本识别的大规模合成阿拉伯文OCR数据集
标题: SARD: A Large-Scale Synthetic Arabic OCR Dataset for Book-Style Text Recognition
Omer Nacar, Yasser Al-Habashi, Serry Sibaee, Adel Ammar, Wadii Boulila
主题: 计算机视觉与模式识别 (cs.CV)
[37] arXiv:2505.24567 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 释放中间域的力量用于混合域半监督医学图像分割
标题: Unleashing the Power of Intermediate Domains for Mixed Domain Semi-Supervised Medical Image Segmentation
Qinghe Ma, Jian Zhang, Lei Qi, Qian Yu, Yinghuan Shi, Yang Gao
评论: 已被IEEE TMI 2025接受。arXiv管理员备注:文本与arXiv:2404.08951存在重叠。
主题: 计算机视觉与模式识别 (cs.CV)
[38] arXiv:2505.24558 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 加权最优卷积用于分类和去噪
标题: Optimal Weighted Convolution for Classification and Denosing
Simone Cammarasana, Giuseppe Patanè
评论: 17页,3个图,6个表格
主题: 计算机视觉与模式识别 (cs.CV)
[39] arXiv:2505.24541 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: Mixpert:通过高效视觉专家混合缓解多模态学习冲突
标题: Mixpert: Mitigating Multimodal Learning Conflicts with Efficient Mixture-of-Vision-Experts
Xin He, Xumeng Han, Longhui Wei, Lingxi Xie, Qi Tian
主题: 计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI)
[40] arXiv:2505.24528 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 面向可持续发展目标的地理空间基础模型
标题: Geospatial Foundation Models to Enable Progress on Sustainable Development Goals
Pedram Ghamisi, Weikang Yu, Xiaokang Zhang, Aldino Rizaldy, Jian Wang, Chufeng Zhou, Richard Gloaguen, Gustau Camps-Valls
主题: 计算机视觉与模式识别 (cs.CV) ; 机器学习 (cs.LG)
[41] arXiv:2505.24527 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 学习模型中加权卷积的最优密度函数
标题: Optimal Density Functions for Weighted Convolution in Learning Models
Simone Cammarasana, Giuseppe Patanè
评论: 5幅图表,5张表格,21页
主题: 计算机视觉与模式识别 (cs.CV) ; 机器学习 (cs.LG)
[42] arXiv:2505.24521 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: UniGeo:用于统一一致几何估计的视频扩散控制
标题: UniGeo: Taming Video Diffusion for Unified Consistent Geometry Estimation
Yang-Tian Sun, Xin Yu, Zehuan Huang, Yi-Hua Huang, Yuan-Chen Guo, Ziyi Yang, Yan-Pei Cao, Xiaojuan Qi
评论: 项目页面:https://sunyangtian.github.io/UniGeo-web/
主题: 计算机视觉与模式识别 (cs.CV)
[43] arXiv:2505.24519 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: AMIA:自动掩码与联合意图分析使LVLMs成为强大的越狱防御者
标题: AMIA: Automatic Masking and Joint Intention Analysis Makes LVLMs Robust Jailbreak Defenders
Yuqi Zhang, Yuchun Miao, Zuchao Li, Liang Ding
评论: 11页,7幅图
主题: 计算机视觉与模式识别 (cs.CV) ; 计算与语言 (cs.CL)
[44] arXiv:2505.24517 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 一个$^2$CLIP:通过反向 unCLIP 提高 CLIP 的视觉细节捕获能力
标题: un$^2$CLIP: Improving CLIP's Visual Detail Capturing Ability via Inverting unCLIP
Yinqi Li, Jiahe Zhao, Hong Chang, Ruibing Hou, Shiguang Shan, Xilin Chen
主题: 计算机视觉与模式识别 (cs.CV)
[45] arXiv:2505.24499 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: Reason-SVG:矢量图形生成中的混合奖励强化学习
标题: Reason-SVG: Hybrid Reward RL for Aha-Moments in Vector Graphics Generation
Ximing Xing, Yandong Guan, Jing Zhang, Dong Xu, Qian Yu
评论: 17页,5幅图
主题: 计算机视觉与模式识别 (cs.CV)
[46] arXiv:2505.24489 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 应用于遥感目标检测的可变形注意力机制
标题: Deformable Attention Mechanisms Applied to Object Detection, case of Remote Sensing
Anasse Boutayeb, Iyad Lahsen-cherif, Ahmed El Khadimi
评论: 10页,5幅图,论文被第29届国际基于知识和智能信息系统会议(KES 2025)接受,日本大阪
期刊参考: 第1版关于地球智能观测与保护的特邀会议,将于2025年在日本大阪举行的第29届知识型和智能信息系统国际会议(KES 2025)同期举办。
主题: 计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI)
[47] arXiv:2505.24481 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: ACM-UNet:基于CNN和Mamba自适应融合的高效医学图像分割
标题: ACM-UNet: Adaptive Integration of CNNs and Mamba for Efficient Medical Image Segmentation
Jing Huang, Yongkang Zhao, Yuhan Li, Zhitao Dai, Cheng Chen, Qiying Lai
评论: 10页,3个图,5个表格
主题: 计算机视觉与模式识别 (cs.CV)
[48] arXiv:2505.24476 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 周期-LLM:扩展多模态大型语言模型的周期能力
标题: Period-LLM: Extending the Periodic Capability of Multimodal Large Language Model
Yuting Zhang, Hao Lu, Qingyong Hu, Yin Wang, Kaishen Yuan, Xin Liu, Kaishun Wu
评论: 已被CVPR 2025接受
主题: 计算机视觉与模式识别 (cs.CV)
[49] arXiv:2505.24475 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: SPPSFormer:基于高质量超点的用于点云屋顶平面实例分割的Transformer
标题: SPPSFormer: High-quality Superpoint-based Transformer for Roof Plane Instance Segmentation from Point Clouds
Cheng Zeng, Xiatian Qi, Chi Chen, Kai Sun, Wangle Zhang, Yuxuan Liu, Yan Meng, Bisheng Yang
评论: 18页,8幅图
主题: 计算机视觉与模式识别 (cs.CV)
[50] arXiv:2505.24466 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 场景感知重排序的基于文本的人物检索
标题: SA-Person: Text-Based Person Retrieval with Scene-aware Re-ranking
Yingjia Xu, Jinlin Wu, Zhen Chen, Daming Gao, Yang Yang, Zhen Lei, Min Cao
评论: 22页,7幅图。正在审稿中。
主题: 计算机视觉与模式识别 (cs.CV)
总共 1030 条目 : 1-50 51-100 101-150 151-200 ... 1001-1030
显示最多 50 每页条目: 较少 | 更多 | 所有
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号