Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > cs.CV

帮助 | 高级搜索

计算机视觉与模式识别

2025年06月 的作者和标题

总共 3129 条目 : 1-25 ... 3026-3050 3051-3075 3076-3100 3101-3125 3126-3129
显示最多 25 每页条目: 较少 | 更多 | 所有
[3101] arXiv:2506.23309 (交叉列表自 eess.IV) [中文pdf, pdf, html, 其他]
标题: SurgTPGS:具有文本提示的高斯点云语义3D外科场景理解
标题: SurgTPGS: Semantic 3D Surgical Scene Understanding with Text Promptable Gaussian Splatting
Yiming Huang, Long Bai, Beilei Cui, Kun Yuan, Guankun Wang, Mobarak I. Hoque, Nicolas Padoy, Nassir Navab, Hongliang Ren
评论: MICCAI 2025。项目页面: https://lastbasket.github.io/MICCAI-2025-SurgTPGS/
主题: 图像与视频处理 (eess.IV) ; 计算机视觉与模式识别 (cs.CV)
[3102] arXiv:2506.23316 (交叉列表自 cs.RO) [中文pdf, pdf, html, 其他]
标题: InfGen:场景生成作为下一个标记组预测
标题: InfGen: Scenario Generation as Next Token Group Prediction
Zhenghao Peng, Yuxin Liu, Bolei Zhou
主题: 机器人技术 (cs.RO) ; 计算机视觉与模式识别 (cs.CV)
[3103] arXiv:2506.23334 (交叉列表自 eess.IV) [中文pdf, pdf, html, 其他]
标题: 基于合成超声图像增强的联邦乳腺癌检测
标题: Federated Breast Cancer Detection Enhanced by Synthetic Ultrasound Image Augmentation
Hongyi Pan, Ziliang Hong, Gorkem Durak, Ziyue Xu, Ulas Bagci
主题: 图像与视频处理 (eess.IV) ; 人工智能 (cs.AI) ; 计算机视觉与模式识别 (cs.CV)
[3104] arXiv:2506.23466 (交叉列表自 eess.IV) [中文pdf, pdf, 其他]
标题: FD-DiT:频域引导的扩散变压器用于低剂量CT重建
标题: FD-DiT: Frequency Domain-Directed Diffusion Transformer for Low-Dose CT Reconstruction
Qiqing Liu, Guoquan Wei, Zekun Zhou, Yiyang Wen, Liu Shi, Qiegen Liu
评论: 11页,11图
主题: 图像与视频处理 (eess.IV) ; 计算机视觉与模式识别 (cs.CV) ; 医学物理 (physics.med-ph)
[3105] arXiv:2506.23471 (交叉列表自 cs.IR) [中文pdf, pdf, html, 其他]
标题: KiseKloset:服装检索、推荐和试穿的综合系统
标题: KiseKloset: Comprehensive System For Outfit Retrieval, Recommendation, And Try-On
Thanh-Tung Phan-Nguyen, Khoi-Nguyen Nguyen-Ngoc, Tam V. Nguyen, Minh-Triet Tran, Trung-Nghia Le
主题: 信息检索 (cs.IR) ; 计算机视觉与模式识别 (cs.CV)
[3106] arXiv:2506.23484 (交叉列表自 cs.MM) [中文pdf, pdf, html, 其他]
标题: TAG-WM:通过扩散反演敏感性感知篡改的生成图像水印
标题: TAG-WM: Tamper-Aware Generative Image Watermarking via Diffusion Inversion Sensitivity
Yuzhuo Chen, Zehua Ma, Han Fang, Weiming Zhang, Nenghai Yu
评论: 被ICCV 2025接收(2025 IEEE/CVF国际计算机视觉会议)
主题: 多媒体 (cs.MM) ; 计算机视觉与模式识别 (cs.CV) ; 图像与视频处理 (eess.IV)
[3107] arXiv:2506.23490 (交叉列表自 eess.IV) [中文pdf, pdf, html, 其他]
标题: UltraTwin:从多视图2D超声波走向心脏解剖双生体生成
标题: UltraTwin: Towards Cardiac Anatomical Twin Generation from Multi-view 2D Ultrasound
Junxuan Yu, Yaofei Duan, Yuhao Huang, Yu Wang, Rongbo Ling, Weihao Luo, Ang Zhang, Jingxian Xu, Qiongying Ni, Yongsong Zhou, Binghan Li, Haoran Dou, Liping Liu, Yanfen Chu, Feng Geng, Zhe Sheng, Zhifeng Ding, Dingxin Zhang, Rui Huang, Yuhang Zhang, Xiaowei Xu, Tao Tan, Dong Ni, Zhongshan Gou, Xin Yang
评论: 被MICCAI 2025接受
主题: 图像与视频处理 (eess.IV) ; 人工智能 (cs.AI) ; 计算机视觉与模式识别 (cs.CV)
[3108] arXiv:2506.23492 (交叉列表自 cs.LG) [中文pdf, pdf, html, 其他]
标题: 样本边缘感知的温度校准
标题: Sample Margin-Aware Recalibration of Temperature Scaling
Haolan Guo, Linwei Tao, Haoyang Luo, Minjing Dong, Chang Xu
主题: 机器学习 (cs.LG) ; 人工智能 (cs.AI) ; 计算机视觉与模式识别 (cs.CV)
[3109] arXiv:2506.23506 (交叉列表自 eess.IV) [中文pdf, pdf, 其他]
标题: 人工智能辅助的像素级肺部(APL)评分用于超短回波时间磁共振成像中的快速准确量化
标题: Artificial Intelligence-assisted Pixel-level Lung (APL) Scoring for Fast and Accurate Quantification in Ultra-short Echo-time MRI
Bowen Xin, Rohan Hickey, Tamara Blake, Jin Jin, Claire E Wainwright, Thomas Benkert, Alto Stemmer, Peter Sly, David Coman, Jason Dowling
评论: 口头报告在ISMRM2025上
主题: 图像与视频处理 (eess.IV) ; 人工智能 (cs.AI) ; 计算机视觉与模式识别 (cs.CV) ; 医学物理 (physics.med-ph)
[3110] arXiv:2506.23516 (交叉列表自 cs.LG) [中文pdf, pdf, html, 其他]
标题: FedWSQ:具有权重标准化和分布感知非均匀量化的大规模联邦学习
标题: FedWSQ: Efficient Federated Learning with Weight Standardization and Distribution-Aware Non-Uniform Quantization
Seung-Wook Kim, Seongyeol Kim, Jiah Kim, Seowon Ji, Se-Ho Lee
主题: 机器学习 (cs.LG) ; 人工智能 (cs.AI) ; 计算机视觉与模式识别 (cs.CV)
[3111] arXiv:2506.23537 (交叉列表自 eess.IV) [中文pdf, pdf, html, 其他]
标题: AFUNet:通过深度展开范式进行HDR重建的交叉迭代对齐-融合协同
标题: AFUNet: Cross-Iterative Alignment-Fusion Synergy for HDR Reconstruction via Deep Unfolding Paradigm
Xinyue Li, Zhangkai Ni, Wenhan Yang
评论: 被国际计算机视觉会议(ICCV)2025接收
主题: 图像与视频处理 (eess.IV) ; 计算机视觉与模式识别 (cs.CV)
[3112] arXiv:2506.23563 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]
标题: MMReason:面向通用人工智能的开放性多模态多步骤推理基准
标题: MMReason: An Open-Ended Multi-Modal Multi-Step Reasoning Benchmark for MLLMs Toward AGI
Huanjin Yao, Jiaxing Huang, Yawen Qiu, Michael K. Chen, Wenzheng Liu, Wei Zhang, Wenjie Zeng, Xikun Zhang, Jingyi Zhang, Yuxin Song, Wenhao Wu, Dacheng Tao
评论: 技术报告
主题: 人工智能 (cs.AI) ; 计算与语言 (cs.CL) ; 计算机视觉与模式识别 (cs.CV)
[3113] arXiv:2506.23584 (交叉列表自 eess.IV) [中文pdf, pdf, html, 其他]
标题: 基于临床的两阶段肾CT报告生成框架
标题: A Clinically-Grounded Two-Stage Framework for Renal CT Report Generation
Renjie Liang, Zhengkang Fan, Jinqian Pan, Chenkun Sun, Russell Terry, Jie Xu
主题: 图像与视频处理 (eess.IV) ; 人工智能 (cs.AI) ; 计算机视觉与模式识别 (cs.CV)
[3114] arXiv:2506.23664 (交叉列表自 eess.IV) [中文pdf, pdf, html, 其他]
标题: 基于扩散模型的胎儿头部超声分割数据增强方法
标题: Diffusion Model-based Data Augmentation Method for Fetal Head Ultrasound Segmentation
Fangyijie Wang, Kevin Whelan, Félix Balado, Guénolé Silvestre, Kathleen M. Curran
主题: 图像与视频处理 (eess.IV) ; 计算机视觉与模式识别 (cs.CV)
[3115] arXiv:2506.23700 (交叉列表自 eess.IV) [中文pdf, pdf, html, 其他]
标题: MedSAM-CA:一种带有注意力增强多尺度融合的卷积神经网络增强型ViT用于医学图像分割
标题: MedSAM-CA: A CNN-Augmented ViT with Attention-Enhanced Multi-Scale Fusion for Medical Image Segmentation
Peiting Tian, Xi Chen, Haixia Bi, Fan Li
主题: 图像与视频处理 (eess.IV) ; 计算机视觉与模式识别 (cs.CV)
[3116] arXiv:2506.23701 (交叉列表自 eess.IV) [中文pdf, pdf, html, 其他]
标题: MDPG:多领域扩散先验引导的MRI重建
标题: MDPG: Multi-domain Diffusion Prior Guidance for MRI Reconstruction
Lingtong Zhang, Mengdie Song, Xiaohan Hao, Huayu Mai, Bensheng Qiu
评论: 通过MICCAI2025
主题: 图像与视频处理 (eess.IV) ; 计算机视觉与模式识别 (cs.CV)
[3117] arXiv:2506.23717 (交叉列表自 cs.NE) [中文pdf, pdf, html, 其他]
标题: 通过自适应位分配实现高效且准确的脉冲神经网络
标题: Towards Efficient and Accurate Spiking Neural Networks via Adaptive Bit Allocation
Xingting Yao, Qinghao Hu, Fei Zhou, Tielong Liu, Gang Li, Peisong Wang, Jian Cheng
主题: 神经与进化计算 (cs.NE) ; 人工智能 (cs.AI) ; 计算机视觉与模式识别 (cs.CV) ; 机器学习 (cs.LG)
[3118] arXiv:2506.23721 (交叉列表自 eess.IV) [中文pdf, pdf, html, 其他]
标题: 基于深度学习的语义分割在增强现实辅助超声实时肾脏成像与测量中的应用
标题: Deep Learning-Based Semantic Segmentation for Real-Time Kidney Imaging and Measurements with Augmented Reality-Assisted Ultrasound
Gijs Luijten, Roberto Maria Scardigno, Lisle Faray de Paiva, Peter Hoyer, Jens Kleesiek, Domenico Buongiorno, Vitoantonio Bevilacqua, Jan Egger
主题: 图像与视频处理 (eess.IV) ; 人工智能 (cs.AI) ; 计算机视觉与模式识别 (cs.CV) ; 人机交互 (cs.HC) ; 机器学习 (cs.LG)
[3119] arXiv:2506.23731 (交叉列表自 cs.LG) [中文pdf, pdf, html, 其他]
标题: 扩散和自回归图像生成模型中的放射性水印
标题: Radioactive Watermarks in Diffusion and Autoregressive Image Generative Models
Michel Meintz, Jan Dubiński, Franziska Boenisch, Adam Dziedzic
主题: 机器学习 (cs.LG) ; 计算机视觉与模式识别 (cs.CV)
[3120] arXiv:2506.23759 (交叉列表自 eess.IV) [中文pdf, pdf, html, 其他]
标题: 手术视频中联邦仪器分割的时空表示解耦与增强
标题: Spatio-Temporal Representation Decoupling and Enhancement for Federated Instrument Segmentation in Surgical Videos
Zheng Fang, Xiaoming Qi, Chun-Mei Feng, Jialun Pei, Weixin Si, Yueming Jin
主题: 图像与视频处理 (eess.IV) ; 计算机视觉与模式识别 (cs.CV)
[3121] arXiv:2506.23824 (交叉列表自 cs.LG) [中文pdf, pdf, html, 其他]
标题: 超簇:重新审视半监督学习中的聚类
标题: Supercm: Revisiting Clustering for Semi-Supervised Learning
Durgesh Singh, Ahcene Boubekki, Robert Jenssen, Michael C. Kampffmeyer
期刊参考: 10.1109/ICASSP49357.2023.10095856
主题: 机器学习 (cs.LG) ; 计算机视觉与模式识别 (cs.CV)
[3122] arXiv:2506.23957 (交叉列表自 cs.GR) [中文pdf, pdf, html, 其他]
标题: GaVS:通过时间一致的局部重建和渲染进行3D定位的视频稳定化
标题: GaVS: 3D-Grounded Video Stabilization via Temporally-Consistent Local Reconstruction and Rendering
Zinuo You, Stamatios Georgoulis, Anpei Chen, Siyu Tang, Dengxin Dai
评论: SIGGRAPH 2025,项目网站:https://sinoyou.github.io/gavs
主题: 图形学 (cs.GR) ; 计算机视觉与模式识别 (cs.CV)
[3123] arXiv:2506.24000 (交叉列表自 cs.LG) [中文pdf, pdf, html, 其他]
标题: 进步的幻觉? 对视觉-语言模型测试时适应的批判性审视
标题: The Illusion of Progress? A Critical Look at Test-Time Adaptation for Vision-Language Models
Lijun Sheng, Jian Liang, Ran He, Zilei Wang, Tieniu Tan
评论: Github链接:https://github.com/TomSheng21/tta-vlm
主题: 机器学习 (cs.LG) ; 计算机视觉与模式识别 (cs.CV)
[3124] arXiv:2506.24003 (交叉列表自 eess.IV) [中文pdf, pdf, html, 其他]
标题: 形状工具包
标题: ShapeKit
Junqi Liu, Dongli He, Wenxuan Li, Ningyu Wang, Alan L. Yuille, Zongwei Zhou
主题: 图像与视频处理 (eess.IV) ; 计算机视觉与模式识别 (cs.CV)
[3125] arXiv:2506.24016 (交叉列表自 cs.CL) [中文pdf, pdf, html, 其他]
标题: 专家:具有结构化解释的可解释图像字幕评估指标
标题: EXPERT: An Explainable Image Captioning Evaluation Metric with Structured Explanations
Hyunjong Kim, Sangyeop Kim, Jongheon Jeong, Yeongjae Cho, Sungzoon Cho
评论: 被ACL 2025收录为发现成果
主题: 计算与语言 (cs.CL) ; 人工智能 (cs.AI) ; 计算机视觉与模式识别 (cs.CV)
总共 3129 条目 : 1-25 ... 3026-3050 3051-3075 3076-3100 3101-3125 3126-3129
显示最多 25 每页条目: 较少 | 更多 | 所有
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号