计算机视觉与模式识别

2025年09月的作者和标题

总共 432 条目 : 1-50 51-100 101-150 151-200 ... 401-432

显示最多 50 每页条目：较少 | 更多 | 所有

[1] arXiv:2509.00033 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：基于深度学习的烹饪场景下多模态目标检测与运动分析

标题： Deep Learning-Driven Multimodal Detection and Movement Analysis of Objects in Culinary

Tahoshin Alam Ishat

评论： 8页，9图

主题：计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI)
[2] arXiv:2509.00039 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： AMMKD：自适应多模态多教师蒸馏用于轻量级视觉-语言模型

标题： AMMKD: Adaptive Multimodal Multi-teacher Distillation for Lightweight Vision-Language Models

Yuqi Li, Chuanguang Yang, Junhao Dong, Zhengtao Yao, Haoyan Xu, Zeyu Dong, Hansheng Zeng, Zhulin An, Yingli Tian

评论： 9页

主题：计算机视觉与模式识别 (cs.CV)
[3] arXiv:2509.00042 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： ARTPS：深度增强的混合异常检测和可学习的好奇分值用于自主探测器目标优先级排序

标题： ARTPS: Depth-Enhanced Hybrid Anomaly Detection and Learnable Curiosity Score for Autonomous Rover Target Prioritization

Poyraz Baydemir

评论： 18页，12图，4表，自主探索，火星车，计算机视觉，异常检测，深度估计，好奇心驱动的探索

主题：计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI)
[4] arXiv:2509.00045 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：性能并非一切：算法的可持续性考虑

标题： Performance is not All You Need: Sustainability Considerations for Algorithms

Xiang Li, Chong Zhang, Hongpeng Wang, Shreyank Narayana Gowda, Yushi Li, Xiaobo Jin

评论： 18页，6图。被2025年中国模式识别与计算机视觉会议接收

主题：计算机视觉与模式识别 (cs.CV) ; 性能 (cs.PF)
[5] arXiv:2509.00056 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： MESTI-MEGANet：用于微表情识别的微表情时空图像和微表情梯度注意力网络

标题： MESTI-MEGANet: Micro-expression Spatio-Temporal Image and Micro-expression Gradient Attention Networks for Micro-expression Recognition

Luu Tu Nguyen, Vu Tram Anh Khuong, Thanh Ha Le, Thi Duyen Ngo

主题：计算机视觉与模式识别 (cs.CV)
[6] arXiv:2509.00062 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：支架扩散：具有离散扩散的稀疏多类别体素结构生成

标题： Scaffold Diffusion: Sparse Multi-Category Voxel Structure Generation with Discrete Diffusion

Justin Jung

评论：评论：6页，LaTeX；错误更正，添加了图表

主题：计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI) ; 机器学习 (cs.LG)
[7] arXiv:2509.00108 (交叉列表自 cs.CV) [中文pdf, pdf, 其他]: 标题：双阶段全局和局部特征框架用于图像去雾

标题： Dual-Stage Global and Local Feature Framework for Image Dehazing

Anas M. Ali, Anis Koubaa, Bilel Benjdira

主题：计算机视觉与模式识别 (cs.CV)
[8] arXiv:2509.00131 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：药物安全性评估研究中的自监督大规模肾脏异常检测

标题： Self-supervised large-scale kidney abnormality detection in drug safety assessment studies

Ivan Slootweg, Natalia P. García-De-La-Puente, Geert Litjens, Salma Dammak

主题：计算机视觉与模式识别 (cs.CV) ; 图像与视频处理 (eess.IV) ; 定量方法 (q-bio.QM)
[9] arXiv:2509.00176 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： Waste-Bench：在杂乱环境中评估VLLM的综合基准

标题： Waste-Bench: A Comprehensive Benchmark for Evaluating VLLMs in Cluttered Environments

Muhammad Ali, Salman Khan

主题：计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI)
[10] arXiv:2509.00177 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：类别级文本到图像检索改进：使用扩散模型和视觉编码器弥合领域差距

标题： Category-level Text-to-Image Retrieval Improved: Bridging the Domain Gap with Diffusion Models and Vision Encoders

Faizan Farooq Khan, Vladan Stojnić, Zakaria Laskar, Mohamed Elhoseiny, Giorgos Tolias

评论： BMVC 2025

主题：计算机视觉与模式识别 (cs.CV)
[11] arXiv:2509.00192 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： Safe-LLaVA：一种用于生物特征安全的隐私保护视觉语言数据集和基准测试

标题： Safe-LLaVA: A Privacy-Preserving Vision-Language Dataset and Benchmark for Biometric Safety

Younggun Kim, Sirnam Swetha, Fazil Kagdi, Mubarak Shah

主题：计算机视觉与模式识别 (cs.CV)
[12] arXiv:2509.00210 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：超越像素：通过时空对齐引入基于视频的具身模型的几何语义世界先验

标题： Beyond Pixels: Introducing Geometric-Semantic World Priors for Video-based Embodied Models via Spatio-temporal Alignment

Jinzhou Tang, Jusheng zhang, Sidi Liu, Waikit Xiu, Qinhan Lv, Xiying Li

主题：计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI)
[13] arXiv:2509.00213 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：基于超声和临床数据的多模态深度学习用于叶状肿瘤分类

标题： Multimodal Deep Learning for Phyllodes Tumor Classification from Ultrasound and Clinical Data

Farhan Fuad Abir, Abigail Elliott Daly, Kyle Anderman, Tolga Ozmen, Laura J. Brattain

评论： IEEE-EMBS 国际体感网络会议（IEEE-EMBS BSN 2025）

主题：计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI)
[14] arXiv:2509.00226 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： GraViT：使用视觉变压器和MLP-Mixer进行强引力透镜发现的迁移学习

标题： GraViT: Transfer Learning with Vision Transformers and MLP-Mixer for Strong Gravitational Lens Discovery

René Parlange, Juan C. Cuevas-Tello, Octavio Valenzuela, Omar de J. Cabrera-Rosas, Tomás Verdugo, Anupreeta More, Anton T. Jaelani

评论：我们公开可用的微调模型为LSST中的引力透镜发现提供了可扩展的迁移学习解决方案。已提交至MNRAS。欢迎提出意见。

主题：计算机视觉与模式识别 (cs.CV) ; 星系的天体物理学 (astro-ph.GA)
[15] arXiv:2509.00231 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：一种针对任意形状图像的高精度快速霍夫变换，具有线性对数立方计算复杂度

标题： A High-Accuracy Fast Hough Transform with Linear-Log-Cubed Computational Complexity for Arbitrary-Shaped Images

Danil Kazimirov, Dmitry Nikolaev

评论： 8页，4个图。被国际机器视觉会议2025（ICMV 2025）接收

主题：计算机视觉与模式识别 (cs.CV)
[16] arXiv:2509.00284 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：工业轮廓检测的生成式人工智能：一种语言引导的视觉系统

标题： Generative AI for Industrial Contour Detection: A Language-Guided Vision System

Liang Gong, Tommy (Zelin)Wang, Sara Chaker, Yanchen Dong, Fouad Bousetouane, Brenden Morton, Mark Mendez

评论： 20页，5图

主题：计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI)
[17] arXiv:2509.00305 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：语言感知的信息最大化用于归纳少样本CLIP

标题： Language-Aware Information Maximization for Transductive Few-Shot CLIP

Ghassen Baklouti, Maxime Zanella, Ismail Ben Ayed

主题：计算机视觉与模式识别 (cs.CV)
[18] arXiv:2509.00311 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： MorphGen：用于组织病理学癌症分类中鲁棒单域泛化的形态学引导表示学习

标题： MorphGen: Morphology-Guided Representation Learning for Robust Single-Domain Generalization in Histopathological Cancer Classification

Hikmat Khan, Syed Farhan Alam Zaidi, Pir Masoom Shah, Kiruthika Balakrishnan, Rabia Khan, Muhammad Waqas, Jia Wu

主题：计算机视觉与模式识别 (cs.CV)
[19] arXiv:2509.00320 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：面向大型多模态模型的自适应视觉标记剪枝

标题： Towards Adaptive Visual Token Pruning for Large Multimodal Models

Hao Zhang, Mengsi Lyu, Chenrui He, Yulong Ao, Yonghua Lin

评论： 10页

主题：计算机视觉与模式识别 (cs.CV)
[20] arXiv:2509.00332 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： CryptoFace：端到端加密人脸识别

标题： CryptoFace: End-to-End Encrypted Face Recognition

Wei Ao, Vishnu Naresh Boddeti

评论： CVPR 2025

主题：计算机视觉与模式识别 (cs.CV) ; 密码学与安全 (cs.CR)
[21] arXiv:2509.00346 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： LUT-Fuse：通过蒸馏学习可学习查找表实现极快的红外与可见光图像融合

标题： LUT-Fuse: Towards Extremely Fast Infrared and Visible Image Fusion via Distillation to Learnable Look-Up Tables

Xunpeng Yi, Yibing Zhang, Xinyu Xiang, Qinglong Yan, Han Xu, Jiayi Ma

评论：被ICCV 2025接收

主题：计算机视觉与模式识别 (cs.CV)
[22] arXiv:2509.00351 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：面向目标的单域泛化

标题： Target-Oriented Single Domain Generalization

Marzi Heidari, Yuhong Guo

主题：计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI) ; 机器学习 (cs.LG)
[23] arXiv:2509.00353 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： AQFusionNet：利用图像和传感器数据进行空气质量指数预测的多模态深度学习

标题： AQFusionNet: Multimodal Deep Learning for Air Quality Index Prediction with Imagery and Sensor Data

Koushik Ahmed Kushal, Abdullah Al Mamun

评论： 8页，5图，2表

主题：计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI)
[24] arXiv:2509.00356 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：迭代低秩网络用于高光谱图像去噪

标题： Iterative Low-rank Network for Hyperspectral Image Denoising

Jin Ye, Fengchao Xiong, Jun Zhou, Yuntao Qian

期刊参考： TGRS 2024

主题：计算机视觉与模式识别 (cs.CV)
[25] arXiv:2509.00357 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： SurgLLM：一种具有空间关注和时间意识的通用大型多模态模型，用于手术视频理解

标题： SurgLLM: A Versatile Large Multimodal Model with Spatial Focus and Temporal Awareness for Surgical Video Understanding

Zhen Chen, Xingjian Luo, Kun Yuan, Jinlin Wu, Danny T.M. Chan, Nassir Navab, Hongbin Liu, Zhen Lei, Jiebo Luo

主题：计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI) ; 机器学习 (cs.LG)
[26] arXiv:2509.00367 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：多模态多中心头颈癌数据集用于肿瘤分割和预后预测

标题： A Multimodal and Multi-centric Head and Neck Cancer Dataset for Tumor Segmentation and Outcome Prediction

Numan Saeed, Salma Hassan, Shahad Hardan, Ahmed Aly, Darya Taratynova, Umair Nawaz, Ufaq Khan, Muhammad Ridzuan, Vincent Andrearczyk, Adrien Depeursinge, Mathieu Hatt, Thomas Eugene, Raphaël Metz, Mélanie Dore, Gregory Delpon, Vijay Ram Kumar Papineni, Kareem Wahid, Cem Dede, Alaa Mohamed Shawky Ali, Carlos Sjogreen, Mohamed Naser, Clifton D. Fuller, Valentin Oreiller, Mario Jreige, John O. Prior, Catherine Cheze Le Rest, Olena Tankyevych, Pierre Decazes, Su Ruan, Stephanie Tanadini-Lang, Martin Vallières, Hesham Elhalawani, Ronan Abgral, Romain Floch, Kevin Kerleguer, Ulrike Schick, Maelle Mauguen, Arman Rahmim, Mohammad Yaqub

评论： 10页，5个图表。Numan Saeed是通讯作者。Numan Saeed、Salma Hassan和Shahad Hardan对本工作贡献相同。项目页面：https://hecktor25.grand-challenge.org/

主题：计算机视觉与模式识别 (cs.CV)
[27] arXiv:2509.00371 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：两个原因，而非一个：重新思考多语言大模型中的遗漏和编造幻觉

标题： Two Causes, Not One: Rethinking Omission and Fabrication Hallucinations in MLLMs

Guangzong Si, Hao Yin, Xianfei Li, Qing Ding, Wenlong Liao, Tao He, Pai Peng

评论：预印本，审稿中

主题：计算机视觉与模式识别 (cs.CV)
[28] arXiv:2509.00373 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：激活引导结合偏好优化：对抗视觉语言模型中越狱攻击的防御方法

标题： Activation Steering Meets Preference Optimization: Defense Against Jailbreaks in Vision Language Models

Sihao Wu, Gaojie Jin, Wei Huang, Jianhong Wang, Xiaowei Huang

主题：计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI)
[29] arXiv:2509.00374 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：自适应点提示微调：用于3D点云分析的异构基础模型微调

标题： Adaptive Point-Prompt Tuning: Fine-Tuning Heterogeneous Foundation Models for 3D Point Cloud Analysis

Mengke Li, Lihao Chen, Peng Zhang, Yiu-ming Cheung, Hui Huang

主题：计算机视觉与模式识别 (cs.CV)
[30] arXiv:2509.00378 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： NoiseCutMix：通过在扩散模型中混合估计噪声的一种新型数据增强方法

标题： NoiseCutMix: A Novel Data Augmentation Approach by Mixing Estimated Noise in Diffusion Models

Shumpei Takezaki, Ryoma Bise, Shinnosuke Matsuo

评论：已被ICCV2025研讨会LIMIT接收

主题：计算机视觉与模式识别 (cs.CV)
[31] arXiv:2509.00379 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：基于领域自适应的跨模态知识蒸馏用于3D语义分割

标题： Domain Adaptation-Based Crossmodal Knowledge Distillation for 3D Semantic Segmentation

Jialiang Kang, Jiawen Wang, Dingsheng Luo

评论： ICRA 2025

主题：计算机视觉与模式识别 (cs.CV) ; 机器人技术 (cs.RO)
[32] arXiv:2509.00381 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：视觉基础叙述：减少研究者与参与者互动中的认知负担

标题： Visually Grounded Narratives: Reducing Cognitive Burden in Researcher-Participant Interaction

Runtong Wu, Jiayao Song, Fei Teng, Xianhao Ren, Yuyan Gao, Kailun Yang

主题：计算机视觉与模式识别 (cs.CV) ; 人机交互 (cs.HC)
[33] arXiv:2509.00385 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： HERO-VQL：分层、自我中心和鲁棒的视觉查询定位

标题： HERO-VQL: Hierarchical, Egocentric and Robust Visual Query Localization

Joohyun Chang, Soyeon Hong, Hyogun Lee, Seong Jong Ha, Dongho Lee, Seong Tae Kim, Jinwoo Choi

评论：被BMVC 2025接收（口头报告），23页，含补充材料

主题：计算机视觉与模式识别 (cs.CV)
[34] arXiv:2509.00395 (交叉列表自 cs.CV) [中文pdf, pdf, 其他]: 标题：带有核正则化的双约束扩散模型用于超低剂量PET重建

标题： Double-Constraint Diffusion Model with Nuclear Regularization for Ultra-low-dose PET Reconstruction

Mengxiao Geng, Ran Hong, Bingxuan Li, Qiegen Liu

主题：计算机视觉与模式识别 (cs.CV)
[35] arXiv:2509.00396 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： DAOVI：失真感知的全向视频修复

标题： DAOVI: Distortion-Aware Omnidirectional Video Inpainting

Ryosuke Seshimo, Mariko Isogawa

评论： BMVC 2025

主题：计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI)
[36] arXiv:2509.00403 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：魔鬼之眼：通过虚拟视角增强单目人体化身重建

标题： DevilSight: Augmenting Monocular Human Avatar Reconstruction through a Virtual Perspective

Yushuo Chen, Ruizhi Shao, Youxin Pang, Hongwen Zhang, Xinyi Wu, Rihui Wu, Yebin Liu

主题：计算机视觉与模式识别 (cs.CV)
[37] arXiv:2509.00419 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： LightVLM：通过金字塔标记合并和KV缓存压缩加速大型多模态模型

标题： LightVLM: Acceleraing Large Multimodal Models with Pyramid Token Merging and KV Cache Compression

Lianyu Hu, Fanhua Shang, Wei Feng, Liang Wan

评论： EMNLP2025 论文集

主题：计算机视觉与模式识别 (cs.CV)
[38] arXiv:2509.00428 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：全局与局部专家混合的扩散Transformer用于可控制的人脸生成

标题： Mixture of Global and Local Experts with Diffusion Transformer for Controllable Face Generation

Xuechao Zou, Shun Zhang, Xing Fu, Yue Li, Kai Li, Yushe Cao, Congyan Lang, Pin Tao, Junliang Xing

评论： 14页，11图

主题：计算机视觉与模式识别 (cs.CV)
[39] arXiv:2509.00442 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： SemaMIL：基于检索引导状态空间建模的语义重排序用于全幻灯片图像分类

标题： SemaMIL: Semantic Reordering with Retrieval-Guided State Space Modeling for Whole Slide Image Classification

Lubin Gan, Xiaoman Wu, Jing Zhang, Zhifeng Wang, Linhao Qu, Siying Wu, Xiaoyan Sun

主题：计算机视觉与模式识别 (cs.CV)
[40] arXiv:2509.00450 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：分阶段自适应标签分布用于面部年龄估计

标题： Stage-wise Adaptive Label Distribution for Facial Age Estimation

Bo Wu, Zhiqi Ai, Jun Jiang, Congcong Zhu, Shugong Xu

评论： 14页，3图

主题：计算机视觉与模式识别 (cs.CV)
[41] arXiv:2509.00451 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：仅编码器图像配准

标题： Encoder-Only Image Registration

Xiang Chen, Renjiu Hu, Jinwei Zhang, Yuxi Zhang, Xinyao Yue, Min Liu, Yaonan Wang, Hang Zhang

主题：计算机视觉与模式识别 (cs.CV)
[42] arXiv:2509.00483 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：探索大语言模型代理的决策能力：一项关于跳跃跳跃游戏的实验研究

标题： Exploring Decision-Making Capabilities of LLM Agents: An Experimental Study on Jump-Jump Game

Juwu Li

主题：计算机视觉与模式识别 (cs.CV)
[43] arXiv:2509.00484 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： VideoRewardBench：多模态奖励模型在视频理解中的综合评估

标题： VideoRewardBench: Comprehensive Evaluation of Multimodal Reward Models for Video Understanding

Zhihong Zhang, Xiaojian Huang, Jin Xu, Zhuodong Luo, Xinzhi Wang, Jiansheng Wei, Xuejin Chen

评论： https://videorewardbench.github.io/

主题：计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI)
[44] arXiv:2509.00490 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：多焦点视频组活动哈希

标题： Multi-Focused Video Group Activities Hashing

Zhongmiao Qi, Yan Jiang, Bolin Zhang, Lijun Guo, Chong Wang, Qiangbo Qian

主题：计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI)
[45] arXiv:2509.00508 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： TRUST：面向跨设备适应的令牌驱动超声风格迁移

标题： TRUST: Token-dRiven Ultrasound Style Transfer for Cross-Device Adaptation

Nhat-Tuong Do-Tran, Ngoc-Hoang-Lam Le, Ian Chiu, Po-Tsun Paul Kuo, Ching-Chun Huang

评论：被APSIPA ASC 2025接受

主题：计算机视觉与模式识别 (cs.CV)
[46] arXiv:2509.00509 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：让我成为专家：从通用黑盒模型中提炼出用于语义分割的专业模型

标题： Make me an Expert: Distilling from Generalist Black-Box Models into Specialized Models for Semantic Segmentation

Yasser Benigmim, Subhankar Roy, Khalid Oublal, Imad Eddine Marouf, Slim Essid, Vicky Kalogeiton, Stéphane Lathuilière

评论： GitHub 仓库：https://github.com/yasserben/ATGC

主题：计算机视觉与模式识别 (cs.CV)
[47] arXiv:2509.00527 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：学习自我：基于语言启发的自举解缠的类增量语义分割

标题： Learning Yourself: Class-Incremental Semantic Segmentation with Language-Inspired Bootstrapped Disentanglement

Ruitao Wu, Yifan Zhao, Jia Li

评论：被ICCV 2025接收

主题：计算机视觉与模式识别 (cs.CV)
[48] arXiv:2509.00549 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：一种与模态无关的人类脑成像多任务基础模型

标题： A Modality-agnostic Multi-task Foundation Model for Human Brain Imaging

Peirong Liu, Oula Puonti, Xiaoling Hu, Karthik Gopinath, Annabel Sorby-Adams, Daniel C. Alexander, W. Taylor Kimberly, Juan E. Iglesias

评论： 16页

主题：计算机视觉与模式识别 (cs.CV)
[49] arXiv:2509.00578 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： C-DiffDet+：融合全局场景上下文与生成去噪的高保真目标检测

标题： C-DiffDet+: Fusing Global Scene Context with Generative Denoising for High-Fidelity Object Detection

Abdellah Zakaria Sellam, Ilyes Benaissa, Salah Eddine Bekhouche, Abdenour Hadid, Vito Renó, Cosimo Distante

主题：计算机视觉与模式识别 (cs.CV)
[50] arXiv:2509.00598 (交叉列表自 cs.CV) [中文pdf, pdf, 其他]: 标题： DGL-RSIS：用于无训练遥感图像分割的解耦全局空间上下文和局部类别语义

标题： DGL-RSIS: Decoupling Global Spatial Context and Local Class Semantics for Training-Free Remote Sensing Image Segmentation

Boyi Li, Ce Zhang, Richard M. Timmerman, Wenxuan Bao

评论：提交至IEEE地球科学与遥感汇刊（TGRS），审稿中

主题：计算机视觉与模式识别 (cs.CV)

总共 432 条目 : 1-50 51-100 101-150 151-200 ... 401-432

显示最多 50 每页条目：较少 | 更多 | 所有

计算机视觉与模式识别

2025年09月 的作者和标题

2025年09月的作者和标题