Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > cs.CV

帮助 | 高级搜索

计算机视觉与模式识别

2025年09月 的作者和标题

总共 432 条目 : 1-50 51-100 101-150 151-200 ... 401-432
显示最多 50 每页条目: 较少 | 更多 | 所有
[1] arXiv:2509.00033 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 基于深度学习的烹饪场景下多模态目标检测与运动分析
标题: Deep Learning-Driven Multimodal Detection and Movement Analysis of Objects in Culinary
Tahoshin Alam Ishat
评论: 8页,9图
主题: 计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI)
[2] arXiv:2509.00039 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: AMMKD:自适应多模态多教师蒸馏用于轻量级视觉-语言模型
标题: AMMKD: Adaptive Multimodal Multi-teacher Distillation for Lightweight Vision-Language Models
Yuqi Li, Chuanguang Yang, Junhao Dong, Zhengtao Yao, Haoyan Xu, Zeyu Dong, Hansheng Zeng, Zhulin An, Yingli Tian
评论: 9页
主题: 计算机视觉与模式识别 (cs.CV)
[3] arXiv:2509.00042 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: ARTPS:深度增强的混合异常检测和可学习的好奇分值用于自主探测器目标优先级排序
标题: ARTPS: Depth-Enhanced Hybrid Anomaly Detection and Learnable Curiosity Score for Autonomous Rover Target Prioritization
Poyraz Baydemir
评论: 18页,12图,4表,自主探索,火星车,计算机视觉,异常检测,深度估计,好奇心驱动的探索
主题: 计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI)
[4] arXiv:2509.00045 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 性能并非一切:算法的可持续性考虑
标题: Performance is not All You Need: Sustainability Considerations for Algorithms
Xiang Li, Chong Zhang, Hongpeng Wang, Shreyank Narayana Gowda, Yushi Li, Xiaobo Jin
评论: 18页,6图。被2025年中国模式识别与计算机视觉会议接收
主题: 计算机视觉与模式识别 (cs.CV) ; 性能 (cs.PF)
[5] arXiv:2509.00056 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: MESTI-MEGANet:用于微表情识别的微表情时空图像和微表情梯度注意力网络
标题: MESTI-MEGANet: Micro-expression Spatio-Temporal Image and Micro-expression Gradient Attention Networks for Micro-expression Recognition
Luu Tu Nguyen, Vu Tram Anh Khuong, Thanh Ha Le, Thi Duyen Ngo
主题: 计算机视觉与模式识别 (cs.CV)
[6] arXiv:2509.00062 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 支架扩散:具有离散扩散的稀疏多类别体素结构生成
标题: Scaffold Diffusion: Sparse Multi-Category Voxel Structure Generation with Discrete Diffusion
Justin Jung
评论: 评论:6页,LaTeX;错误更正,添加了图表
主题: 计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI) ; 机器学习 (cs.LG)
[7] arXiv:2509.00108 (交叉列表自 cs.CV) [中文pdf, pdf, 其他]
标题: 双阶段全局和局部特征框架用于图像去雾
标题: Dual-Stage Global and Local Feature Framework for Image Dehazing
Anas M. Ali, Anis Koubaa, Bilel Benjdira
主题: 计算机视觉与模式识别 (cs.CV)
[8] arXiv:2509.00131 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 药物安全性评估研究中的自监督大规模肾脏异常检测
标题: Self-supervised large-scale kidney abnormality detection in drug safety assessment studies
Ivan Slootweg, Natalia P. García-De-La-Puente, Geert Litjens, Salma Dammak
主题: 计算机视觉与模式识别 (cs.CV) ; 图像与视频处理 (eess.IV) ; 定量方法 (q-bio.QM)
[9] arXiv:2509.00176 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: Waste-Bench:在杂乱环境中评估VLLM的综合基准
标题: Waste-Bench: A Comprehensive Benchmark for Evaluating VLLMs in Cluttered Environments
Muhammad Ali, Salman Khan
主题: 计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI)
[10] arXiv:2509.00177 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 类别级文本到图像检索改进:使用扩散模型和视觉编码器弥合领域差距
标题: Category-level Text-to-Image Retrieval Improved: Bridging the Domain Gap with Diffusion Models and Vision Encoders
Faizan Farooq Khan, Vladan Stojnić, Zakaria Laskar, Mohamed Elhoseiny, Giorgos Tolias
评论: BMVC 2025
主题: 计算机视觉与模式识别 (cs.CV)
[11] arXiv:2509.00192 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: Safe-LLaVA:一种用于生物特征安全的隐私保护视觉语言数据集和基准测试
标题: Safe-LLaVA: A Privacy-Preserving Vision-Language Dataset and Benchmark for Biometric Safety
Younggun Kim, Sirnam Swetha, Fazil Kagdi, Mubarak Shah
主题: 计算机视觉与模式识别 (cs.CV)
[12] arXiv:2509.00210 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 超越像素:通过时空对齐引入基于视频的具身模型的几何语义世界先验
标题: Beyond Pixels: Introducing Geometric-Semantic World Priors for Video-based Embodied Models via Spatio-temporal Alignment
Jinzhou Tang, Jusheng zhang, Sidi Liu, Waikit Xiu, Qinhan Lv, Xiying Li
主题: 计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI)
[13] arXiv:2509.00213 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 基于超声和临床数据的多模态深度学习用于叶状肿瘤分类
标题: Multimodal Deep Learning for Phyllodes Tumor Classification from Ultrasound and Clinical Data
Farhan Fuad Abir, Abigail Elliott Daly, Kyle Anderman, Tolga Ozmen, Laura J. Brattain
评论: IEEE-EMBS 国际体感网络会议(IEEE-EMBS BSN 2025)
主题: 计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI)
[14] arXiv:2509.00226 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: GraViT:使用视觉变压器和MLP-Mixer进行强引力透镜发现的迁移学习
标题: GraViT: Transfer Learning with Vision Transformers and MLP-Mixer for Strong Gravitational Lens Discovery
René Parlange, Juan C. Cuevas-Tello, Octavio Valenzuela, Omar de J. Cabrera-Rosas, Tomás Verdugo, Anupreeta More, Anton T. Jaelani
评论: 我们公开可用的微调模型为LSST中的引力透镜发现提供了可扩展的迁移学习解决方案。已提交至MNRAS。欢迎提出意见。
主题: 计算机视觉与模式识别 (cs.CV) ; 星系的天体物理学 (astro-ph.GA)
[15] arXiv:2509.00231 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 一种针对任意形状图像的高精度快速霍夫变换,具有线性对数立方计算复杂度
标题: A High-Accuracy Fast Hough Transform with Linear-Log-Cubed Computational Complexity for Arbitrary-Shaped Images
Danil Kazimirov, Dmitry Nikolaev
评论: 8页,4个图。被国际机器视觉会议2025(ICMV 2025)接收
主题: 计算机视觉与模式识别 (cs.CV)
[16] arXiv:2509.00284 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 工业轮廓检测的生成式人工智能:一种语言引导的视觉系统
标题: Generative AI for Industrial Contour Detection: A Language-Guided Vision System
Liang Gong, Tommy (Zelin)Wang, Sara Chaker, Yanchen Dong, Fouad Bousetouane, Brenden Morton, Mark Mendez
评论: 20页,5图
主题: 计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI)
[17] arXiv:2509.00305 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 语言感知的信息最大化用于归纳少样本CLIP
标题: Language-Aware Information Maximization for Transductive Few-Shot CLIP
Ghassen Baklouti, Maxime Zanella, Ismail Ben Ayed
主题: 计算机视觉与模式识别 (cs.CV)
[18] arXiv:2509.00311 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: MorphGen:用于组织病理学癌症分类中鲁棒单域泛化的形态学引导表示学习
标题: MorphGen: Morphology-Guided Representation Learning for Robust Single-Domain Generalization in Histopathological Cancer Classification
Hikmat Khan, Syed Farhan Alam Zaidi, Pir Masoom Shah, Kiruthika Balakrishnan, Rabia Khan, Muhammad Waqas, Jia Wu
主题: 计算机视觉与模式识别 (cs.CV)
[19] arXiv:2509.00320 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 面向大型多模态模型的自适应视觉标记剪枝
标题: Towards Adaptive Visual Token Pruning for Large Multimodal Models
Hao Zhang, Mengsi Lyu, Chenrui He, Yulong Ao, Yonghua Lin
评论: 10页
主题: 计算机视觉与模式识别 (cs.CV)
[20] arXiv:2509.00332 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: CryptoFace:端到端加密人脸识别
标题: CryptoFace: End-to-End Encrypted Face Recognition
Wei Ao, Vishnu Naresh Boddeti
评论: CVPR 2025
主题: 计算机视觉与模式识别 (cs.CV) ; 密码学与安全 (cs.CR)
[21] arXiv:2509.00346 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: LUT-Fuse:通过蒸馏学习可学习查找表实现极快的红外与可见光图像融合
标题: LUT-Fuse: Towards Extremely Fast Infrared and Visible Image Fusion via Distillation to Learnable Look-Up Tables
Xunpeng Yi, Yibing Zhang, Xinyu Xiang, Qinglong Yan, Han Xu, Jiayi Ma
评论: 被ICCV 2025接收
主题: 计算机视觉与模式识别 (cs.CV)
[22] arXiv:2509.00351 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 面向目标的单域泛化
标题: Target-Oriented Single Domain Generalization
Marzi Heidari, Yuhong Guo
主题: 计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI) ; 机器学习 (cs.LG)
[23] arXiv:2509.00353 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: AQFusionNet:利用图像和传感器数据进行空气质量指数预测的多模态深度学习
标题: AQFusionNet: Multimodal Deep Learning for Air Quality Index Prediction with Imagery and Sensor Data
Koushik Ahmed Kushal, Abdullah Al Mamun
评论: 8页,5图,2表
主题: 计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI)
[24] arXiv:2509.00356 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 迭代低秩网络用于高光谱图像去噪
标题: Iterative Low-rank Network for Hyperspectral Image Denoising
Jin Ye, Fengchao Xiong, Jun Zhou, Yuntao Qian
期刊参考: TGRS 2024
主题: 计算机视觉与模式识别 (cs.CV)
[25] arXiv:2509.00357 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: SurgLLM:一种具有空间关注和时间意识的通用大型多模态模型,用于手术视频理解
标题: SurgLLM: A Versatile Large Multimodal Model with Spatial Focus and Temporal Awareness for Surgical Video Understanding
Zhen Chen, Xingjian Luo, Kun Yuan, Jinlin Wu, Danny T.M. Chan, Nassir Navab, Hongbin Liu, Zhen Lei, Jiebo Luo
主题: 计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI) ; 机器学习 (cs.LG)
[26] arXiv:2509.00367 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 多模态多中心头颈癌数据集用于肿瘤分割和预后预测
标题: A Multimodal and Multi-centric Head and Neck Cancer Dataset for Tumor Segmentation and Outcome Prediction
Numan Saeed, Salma Hassan, Shahad Hardan, Ahmed Aly, Darya Taratynova, Umair Nawaz, Ufaq Khan, Muhammad Ridzuan, Vincent Andrearczyk, Adrien Depeursinge, Mathieu Hatt, Thomas Eugene, Raphaël Metz, Mélanie Dore, Gregory Delpon, Vijay Ram Kumar Papineni, Kareem Wahid, Cem Dede, Alaa Mohamed Shawky Ali, Carlos Sjogreen, Mohamed Naser, Clifton D. Fuller, Valentin Oreiller, Mario Jreige, John O. Prior, Catherine Cheze Le Rest, Olena Tankyevych, Pierre Decazes, Su Ruan, Stephanie Tanadini-Lang, Martin Vallières, Hesham Elhalawani, Ronan Abgral, Romain Floch, Kevin Kerleguer, Ulrike Schick, Maelle Mauguen, Arman Rahmim, Mohammad Yaqub
评论: 10页,5个图表。Numan Saeed是通讯作者。Numan Saeed、Salma Hassan和Shahad Hardan对本工作贡献相同。项目页面:https://hecktor25.grand-challenge.org/
主题: 计算机视觉与模式识别 (cs.CV)
[27] arXiv:2509.00371 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 两个原因,而非一个:重新思考多语言大模型中的遗漏和编造幻觉
标题: Two Causes, Not One: Rethinking Omission and Fabrication Hallucinations in MLLMs
Guangzong Si, Hao Yin, Xianfei Li, Qing Ding, Wenlong Liao, Tao He, Pai Peng
评论: 预印本,审稿中
主题: 计算机视觉与模式识别 (cs.CV)
[28] arXiv:2509.00373 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 激活引导结合偏好优化:对抗视觉语言模型中越狱攻击的防御方法
标题: Activation Steering Meets Preference Optimization: Defense Against Jailbreaks in Vision Language Models
Sihao Wu, Gaojie Jin, Wei Huang, Jianhong Wang, Xiaowei Huang
主题: 计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI)
[29] arXiv:2509.00374 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 自适应点提示微调:用于3D点云分析的异构基础模型微调
标题: Adaptive Point-Prompt Tuning: Fine-Tuning Heterogeneous Foundation Models for 3D Point Cloud Analysis
Mengke Li, Lihao Chen, Peng Zhang, Yiu-ming Cheung, Hui Huang
主题: 计算机视觉与模式识别 (cs.CV)
[30] arXiv:2509.00378 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: NoiseCutMix:通过在扩散模型中混合估计噪声的一种新型数据增强方法
标题: NoiseCutMix: A Novel Data Augmentation Approach by Mixing Estimated Noise in Diffusion Models
Shumpei Takezaki, Ryoma Bise, Shinnosuke Matsuo
评论: 已被ICCV2025研讨会LIMIT接收
主题: 计算机视觉与模式识别 (cs.CV)
[31] arXiv:2509.00379 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 基于领域自适应的跨模态知识蒸馏用于3D语义分割
标题: Domain Adaptation-Based Crossmodal Knowledge Distillation for 3D Semantic Segmentation
Jialiang Kang, Jiawen Wang, Dingsheng Luo
评论: ICRA 2025
主题: 计算机视觉与模式识别 (cs.CV) ; 机器人技术 (cs.RO)
[32] arXiv:2509.00381 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 视觉基础叙述:减少研究者与参与者互动中的认知负担
标题: Visually Grounded Narratives: Reducing Cognitive Burden in Researcher-Participant Interaction
Runtong Wu, Jiayao Song, Fei Teng, Xianhao Ren, Yuyan Gao, Kailun Yang
主题: 计算机视觉与模式识别 (cs.CV) ; 人机交互 (cs.HC)
[33] arXiv:2509.00385 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: HERO-VQL:分层、自我中心和鲁棒的视觉查询定位
标题: HERO-VQL: Hierarchical, Egocentric and Robust Visual Query Localization
Joohyun Chang, Soyeon Hong, Hyogun Lee, Seong Jong Ha, Dongho Lee, Seong Tae Kim, Jinwoo Choi
评论: 被BMVC 2025接收(口头报告),23页,含补充材料
主题: 计算机视觉与模式识别 (cs.CV)
[34] arXiv:2509.00395 (交叉列表自 cs.CV) [中文pdf, pdf, 其他]
标题: 带有核正则化的双约束扩散模型用于超低剂量PET重建
标题: Double-Constraint Diffusion Model with Nuclear Regularization for Ultra-low-dose PET Reconstruction
Mengxiao Geng, Ran Hong, Bingxuan Li, Qiegen Liu
主题: 计算机视觉与模式识别 (cs.CV)
[35] arXiv:2509.00396 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: DAOVI:失真感知的全向视频修复
标题: DAOVI: Distortion-Aware Omnidirectional Video Inpainting
Ryosuke Seshimo, Mariko Isogawa
评论: BMVC 2025
主题: 计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI)
[36] arXiv:2509.00403 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 魔鬼之眼:通过虚拟视角增强单目人体化身重建
标题: DevilSight: Augmenting Monocular Human Avatar Reconstruction through a Virtual Perspective
Yushuo Chen, Ruizhi Shao, Youxin Pang, Hongwen Zhang, Xinyi Wu, Rihui Wu, Yebin Liu
主题: 计算机视觉与模式识别 (cs.CV)
[37] arXiv:2509.00419 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: LightVLM:通过金字塔标记合并和KV缓存压缩加速大型多模态模型
标题: LightVLM: Acceleraing Large Multimodal Models with Pyramid Token Merging and KV Cache Compression
Lianyu Hu, Fanhua Shang, Wei Feng, Liang Wan
评论: EMNLP2025 论文集
主题: 计算机视觉与模式识别 (cs.CV)
[38] arXiv:2509.00428 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 全局与局部专家混合的扩散Transformer用于可控制的人脸生成
标题: Mixture of Global and Local Experts with Diffusion Transformer for Controllable Face Generation
Xuechao Zou, Shun Zhang, Xing Fu, Yue Li, Kai Li, Yushe Cao, Congyan Lang, Pin Tao, Junliang Xing
评论: 14页,11图
主题: 计算机视觉与模式识别 (cs.CV)
[39] arXiv:2509.00442 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: SemaMIL:基于检索引导状态空间建模的语义重排序用于全幻灯片图像分类
标题: SemaMIL: Semantic Reordering with Retrieval-Guided State Space Modeling for Whole Slide Image Classification
Lubin Gan, Xiaoman Wu, Jing Zhang, Zhifeng Wang, Linhao Qu, Siying Wu, Xiaoyan Sun
主题: 计算机视觉与模式识别 (cs.CV)
[40] arXiv:2509.00450 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 分阶段自适应标签分布用于面部年龄估计
标题: Stage-wise Adaptive Label Distribution for Facial Age Estimation
Bo Wu, Zhiqi Ai, Jun Jiang, Congcong Zhu, Shugong Xu
评论: 14页,3图
主题: 计算机视觉与模式识别 (cs.CV)
[41] arXiv:2509.00451 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 仅编码器图像配准
标题: Encoder-Only Image Registration
Xiang Chen, Renjiu Hu, Jinwei Zhang, Yuxi Zhang, Xinyao Yue, Min Liu, Yaonan Wang, Hang Zhang
主题: 计算机视觉与模式识别 (cs.CV)
[42] arXiv:2509.00483 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 探索大语言模型代理的决策能力:一项关于跳跃跳跃游戏的实验研究
标题: Exploring Decision-Making Capabilities of LLM Agents: An Experimental Study on Jump-Jump Game
Juwu Li
主题: 计算机视觉与模式识别 (cs.CV)
[43] arXiv:2509.00484 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: VideoRewardBench:多模态奖励模型在视频理解中的综合评估
标题: VideoRewardBench: Comprehensive Evaluation of Multimodal Reward Models for Video Understanding
Zhihong Zhang, Xiaojian Huang, Jin Xu, Zhuodong Luo, Xinzhi Wang, Jiansheng Wei, Xuejin Chen
评论: https://videorewardbench.github.io/
主题: 计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI)
[44] arXiv:2509.00490 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 多焦点视频组活动哈希
标题: Multi-Focused Video Group Activities Hashing
Zhongmiao Qi, Yan Jiang, Bolin Zhang, Lijun Guo, Chong Wang, Qiangbo Qian
主题: 计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI)
[45] arXiv:2509.00508 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: TRUST:面向跨设备适应的令牌驱动超声风格迁移
标题: TRUST: Token-dRiven Ultrasound Style Transfer for Cross-Device Adaptation
Nhat-Tuong Do-Tran, Ngoc-Hoang-Lam Le, Ian Chiu, Po-Tsun Paul Kuo, Ching-Chun Huang
评论: 被APSIPA ASC 2025接受
主题: 计算机视觉与模式识别 (cs.CV)
[46] arXiv:2509.00509 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 让我成为专家:从通用黑盒模型中提炼出用于语义分割的专业模型
标题: Make me an Expert: Distilling from Generalist Black-Box Models into Specialized Models for Semantic Segmentation
Yasser Benigmim, Subhankar Roy, Khalid Oublal, Imad Eddine Marouf, Slim Essid, Vicky Kalogeiton, Stéphane Lathuilière
评论: GitHub 仓库:https://github.com/yasserben/ATGC
主题: 计算机视觉与模式识别 (cs.CV)
[47] arXiv:2509.00527 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 学习自我:基于语言启发的自举解缠的类增量语义分割
标题: Learning Yourself: Class-Incremental Semantic Segmentation with Language-Inspired Bootstrapped Disentanglement
Ruitao Wu, Yifan Zhao, Jia Li
评论: 被ICCV 2025接收
主题: 计算机视觉与模式识别 (cs.CV)
[48] arXiv:2509.00549 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 一种与模态无关的人类脑成像多任务基础模型
标题: A Modality-agnostic Multi-task Foundation Model for Human Brain Imaging
Peirong Liu, Oula Puonti, Xiaoling Hu, Karthik Gopinath, Annabel Sorby-Adams, Daniel C. Alexander, W. Taylor Kimberly, Juan E. Iglesias
评论: 16页
主题: 计算机视觉与模式识别 (cs.CV)
[49] arXiv:2509.00578 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: C-DiffDet+:融合全局场景上下文与生成去噪的高保真目标检测
标题: C-DiffDet+: Fusing Global Scene Context with Generative Denoising for High-Fidelity Object Detection
Abdellah Zakaria Sellam, Ilyes Benaissa, Salah Eddine Bekhouche, Abdenour Hadid, Vito Renó, Cosimo Distante
主题: 计算机视觉与模式识别 (cs.CV)
[50] arXiv:2509.00598 (交叉列表自 cs.CV) [中文pdf, pdf, 其他]
标题: DGL-RSIS:用于无训练遥感图像分割的解耦全局空间上下文和局部类别语义
标题: DGL-RSIS: Decoupling Global Spatial Context and Local Class Semantics for Training-Free Remote Sensing Image Segmentation
Boyi Li, Ce Zhang, Richard M. Timmerman, Wenxuan Bao
评论: 提交至IEEE地球科学与遥感汇刊(TGRS),审稿中
主题: 计算机视觉与模式识别 (cs.CV)
总共 432 条目 : 1-50 51-100 101-150 151-200 ... 401-432
显示最多 50 每页条目: 较少 | 更多 | 所有
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号