计算机视觉与模式识别

2025年06月的作者和标题

总共 3129 条目 : 1-25 ... 3026-3050 3051-3075 3076-3100 3101-3125 3126-3129

显示最多 25 每页条目：较少 | 更多 | 所有

[3101] arXiv:2506.23309 (交叉列表自 eess.IV) [中文pdf, pdf, html, 其他]: 标题： SurgTPGS：具有文本提示的高斯点云语义3D外科场景理解

标题： SurgTPGS: Semantic 3D Surgical Scene Understanding with Text Promptable Gaussian Splatting

Yiming Huang, Long Bai, Beilei Cui, Kun Yuan, Guankun Wang, Mobarak I. Hoque, Nicolas Padoy, Nassir Navab, Hongliang Ren

评论： MICCAI 2025。项目页面： https://lastbasket.github.io/MICCAI-2025-SurgTPGS/

主题：图像与视频处理 (eess.IV) ; 计算机视觉与模式识别 (cs.CV)
[3102] arXiv:2506.23316 (交叉列表自 cs.RO) [中文pdf, pdf, html, 其他]: 标题： InfGen：场景生成作为下一个标记组预测

标题： InfGen: Scenario Generation as Next Token Group Prediction

Zhenghao Peng, Yuxin Liu, Bolei Zhou

主题：机器人技术 (cs.RO) ; 计算机视觉与模式识别 (cs.CV)
[3103] arXiv:2506.23334 (交叉列表自 eess.IV) [中文pdf, pdf, html, 其他]: 标题：基于合成超声图像增强的联邦乳腺癌检测

标题： Federated Breast Cancer Detection Enhanced by Synthetic Ultrasound Image Augmentation

Hongyi Pan, Ziliang Hong, Gorkem Durak, Ziyue Xu, Ulas Bagci

主题：图像与视频处理 (eess.IV) ; 人工智能 (cs.AI) ; 计算机视觉与模式识别 (cs.CV)
[3104] arXiv:2506.23466 (交叉列表自 eess.IV) [中文pdf, pdf, 其他]: 标题： FD-DiT：频域引导的扩散变压器用于低剂量CT重建

标题： FD-DiT: Frequency Domain-Directed Diffusion Transformer for Low-Dose CT Reconstruction

Qiqing Liu, Guoquan Wei, Zekun Zhou, Yiyang Wen, Liu Shi, Qiegen Liu

评论： 11页，11图

主题：图像与视频处理 (eess.IV) ; 计算机视觉与模式识别 (cs.CV) ; 医学物理 (physics.med-ph)
[3105] arXiv:2506.23471 (交叉列表自 cs.IR) [中文pdf, pdf, html, 其他]: 标题： KiseKloset：服装检索、推荐和试穿的综合系统

标题： KiseKloset: Comprehensive System For Outfit Retrieval, Recommendation, And Try-On

Thanh-Tung Phan-Nguyen, Khoi-Nguyen Nguyen-Ngoc, Tam V. Nguyen, Minh-Triet Tran, Trung-Nghia Le

主题：信息检索 (cs.IR) ; 计算机视觉与模式识别 (cs.CV)
[3106] arXiv:2506.23484 (交叉列表自 cs.MM) [中文pdf, pdf, html, 其他]: 标题： TAG-WM：通过扩散反演敏感性感知篡改的生成图像水印

标题： TAG-WM: Tamper-Aware Generative Image Watermarking via Diffusion Inversion Sensitivity

Yuzhuo Chen, Zehua Ma, Han Fang, Weiming Zhang, Nenghai Yu

评论：被ICCV 2025接收（2025 IEEE/CVF国际计算机视觉会议）

主题：多媒体 (cs.MM) ; 计算机视觉与模式识别 (cs.CV) ; 图像与视频处理 (eess.IV)
[3107] arXiv:2506.23490 (交叉列表自 eess.IV) [中文pdf, pdf, html, 其他]: 标题： UltraTwin：从多视图2D超声波走向心脏解剖双生体生成

标题： UltraTwin: Towards Cardiac Anatomical Twin Generation from Multi-view 2D Ultrasound

Junxuan Yu, Yaofei Duan, Yuhao Huang, Yu Wang, Rongbo Ling, Weihao Luo, Ang Zhang, Jingxian Xu, Qiongying Ni, Yongsong Zhou, Binghan Li, Haoran Dou, Liping Liu, Yanfen Chu, Feng Geng, Zhe Sheng, Zhifeng Ding, Dingxin Zhang, Rui Huang, Yuhang Zhang, Xiaowei Xu, Tao Tan, Dong Ni, Zhongshan Gou, Xin Yang

评论：被MICCAI 2025接受

主题：图像与视频处理 (eess.IV) ; 人工智能 (cs.AI) ; 计算机视觉与模式识别 (cs.CV)
[3108] arXiv:2506.23492 (交叉列表自 cs.LG) [中文pdf, pdf, html, 其他]: 标题：样本边缘感知的温度校准

标题： Sample Margin-Aware Recalibration of Temperature Scaling

Haolan Guo, Linwei Tao, Haoyang Luo, Minjing Dong, Chang Xu

主题：机器学习 (cs.LG) ; 人工智能 (cs.AI) ; 计算机视觉与模式识别 (cs.CV)
[3109] arXiv:2506.23506 (交叉列表自 eess.IV) [中文pdf, pdf, 其他]: 标题：人工智能辅助的像素级肺部（APL）评分用于超短回波时间磁共振成像中的快速准确量化

标题： Artificial Intelligence-assisted Pixel-level Lung (APL) Scoring for Fast and Accurate Quantification in Ultra-short Echo-time MRI

Bowen Xin, Rohan Hickey, Tamara Blake, Jin Jin, Claire E Wainwright, Thomas Benkert, Alto Stemmer, Peter Sly, David Coman, Jason Dowling

评论：口头报告在ISMRM2025上

主题：图像与视频处理 (eess.IV) ; 人工智能 (cs.AI) ; 计算机视觉与模式识别 (cs.CV) ; 医学物理 (physics.med-ph)
[3110] arXiv:2506.23516 (交叉列表自 cs.LG) [中文pdf, pdf, html, 其他]: 标题： FedWSQ：具有权重标准化和分布感知非均匀量化的大规模联邦学习

标题： FedWSQ: Efficient Federated Learning with Weight Standardization and Distribution-Aware Non-Uniform Quantization

Seung-Wook Kim, Seongyeol Kim, Jiah Kim, Seowon Ji, Se-Ho Lee

主题：机器学习 (cs.LG) ; 人工智能 (cs.AI) ; 计算机视觉与模式识别 (cs.CV)
[3111] arXiv:2506.23537 (交叉列表自 eess.IV) [中文pdf, pdf, html, 其他]: 标题： AFUNet：通过深度展开范式进行HDR重建的交叉迭代对齐-融合协同

标题： AFUNet: Cross-Iterative Alignment-Fusion Synergy for HDR Reconstruction via Deep Unfolding Paradigm

Xinyue Li, Zhangkai Ni, Wenhan Yang

评论：被国际计算机视觉会议（ICCV）2025接收

主题：图像与视频处理 (eess.IV) ; 计算机视觉与模式识别 (cs.CV)
[3112] arXiv:2506.23563 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]: 标题： MMReason：面向通用人工智能的开放性多模态多步骤推理基准

标题： MMReason: An Open-Ended Multi-Modal Multi-Step Reasoning Benchmark for MLLMs Toward AGI

Huanjin Yao, Jiaxing Huang, Yawen Qiu, Michael K. Chen, Wenzheng Liu, Wei Zhang, Wenjie Zeng, Xikun Zhang, Jingyi Zhang, Yuxin Song, Wenhao Wu, Dacheng Tao

评论：技术报告

主题：人工智能 (cs.AI) ; 计算与语言 (cs.CL) ; 计算机视觉与模式识别 (cs.CV)
[3113] arXiv:2506.23584 (交叉列表自 eess.IV) [中文pdf, pdf, html, 其他]: 标题：基于临床的两阶段肾CT报告生成框架

标题： A Clinically-Grounded Two-Stage Framework for Renal CT Report Generation

Renjie Liang, Zhengkang Fan, Jinqian Pan, Chenkun Sun, Russell Terry, Jie Xu

主题：图像与视频处理 (eess.IV) ; 人工智能 (cs.AI) ; 计算机视觉与模式识别 (cs.CV)
[3114] arXiv:2506.23664 (交叉列表自 eess.IV) [中文pdf, pdf, html, 其他]: 标题：基于扩散模型的胎儿头部超声分割数据增强方法

标题： Diffusion Model-based Data Augmentation Method for Fetal Head Ultrasound Segmentation

Fangyijie Wang, Kevin Whelan, Félix Balado, Guénolé Silvestre, Kathleen M. Curran

主题：图像与视频处理 (eess.IV) ; 计算机视觉与模式识别 (cs.CV)
[3115] arXiv:2506.23700 (交叉列表自 eess.IV) [中文pdf, pdf, html, 其他]: 标题： MedSAM-CA：一种带有注意力增强多尺度融合的卷积神经网络增强型ViT用于医学图像分割

标题： MedSAM-CA: A CNN-Augmented ViT with Attention-Enhanced Multi-Scale Fusion for Medical Image Segmentation

Peiting Tian, Xi Chen, Haixia Bi, Fan Li

主题：图像与视频处理 (eess.IV) ; 计算机视觉与模式识别 (cs.CV)
[3116] arXiv:2506.23701 (交叉列表自 eess.IV) [中文pdf, pdf, html, 其他]: 标题： MDPG：多领域扩散先验引导的MRI重建

标题： MDPG: Multi-domain Diffusion Prior Guidance for MRI Reconstruction

Lingtong Zhang, Mengdie Song, Xiaohan Hao, Huayu Mai, Bensheng Qiu

评论：通过MICCAI2025

主题：图像与视频处理 (eess.IV) ; 计算机视觉与模式识别 (cs.CV)
[3117] arXiv:2506.23717 (交叉列表自 cs.NE) [中文pdf, pdf, html, 其他]: 标题：通过自适应位分配实现高效且准确的脉冲神经网络

标题： Towards Efficient and Accurate Spiking Neural Networks via Adaptive Bit Allocation

Xingting Yao, Qinghao Hu, Fei Zhou, Tielong Liu, Gang Li, Peisong Wang, Jian Cheng

主题：神经与进化计算 (cs.NE) ; 人工智能 (cs.AI) ; 计算机视觉与模式识别 (cs.CV) ; 机器学习 (cs.LG)
[3118] arXiv:2506.23721 (交叉列表自 eess.IV) [中文pdf, pdf, html, 其他]: 标题：基于深度学习的语义分割在增强现实辅助超声实时肾脏成像与测量中的应用

标题： Deep Learning-Based Semantic Segmentation for Real-Time Kidney Imaging and Measurements with Augmented Reality-Assisted Ultrasound

Gijs Luijten, Roberto Maria Scardigno, Lisle Faray de Paiva, Peter Hoyer, Jens Kleesiek, Domenico Buongiorno, Vitoantonio Bevilacqua, Jan Egger

主题：图像与视频处理 (eess.IV) ; 人工智能 (cs.AI) ; 计算机视觉与模式识别 (cs.CV) ; 人机交互 (cs.HC) ; 机器学习 (cs.LG)
[3119] arXiv:2506.23731 (交叉列表自 cs.LG) [中文pdf, pdf, html, 其他]: 标题：扩散和自回归图像生成模型中的放射性水印

标题： Radioactive Watermarks in Diffusion and Autoregressive Image Generative Models

Michel Meintz, Jan Dubiński, Franziska Boenisch, Adam Dziedzic

主题：机器学习 (cs.LG) ; 计算机视觉与模式识别 (cs.CV)
[3120] arXiv:2506.23759 (交叉列表自 eess.IV) [中文pdf, pdf, html, 其他]: 标题：手术视频中联邦仪器分割的时空表示解耦与增强

标题： Spatio-Temporal Representation Decoupling and Enhancement for Federated Instrument Segmentation in Surgical Videos

Zheng Fang, Xiaoming Qi, Chun-Mei Feng, Jialun Pei, Weixin Si, Yueming Jin

主题：图像与视频处理 (eess.IV) ; 计算机视觉与模式识别 (cs.CV)
[3121] arXiv:2506.23824 (交叉列表自 cs.LG) [中文pdf, pdf, html, 其他]: 标题：超簇：重新审视半监督学习中的聚类

标题： Supercm: Revisiting Clustering for Semi-Supervised Learning

Durgesh Singh, Ahcene Boubekki, Robert Jenssen, Michael C. Kampffmeyer

期刊参考： 10.1109/ICASSP49357.2023.10095856

主题：机器学习 (cs.LG) ; 计算机视觉与模式识别 (cs.CV)
[3122] arXiv:2506.23957 (交叉列表自 cs.GR) [中文pdf, pdf, html, 其他]: 标题： GaVS：通过时间一致的局部重建和渲染进行3D定位的视频稳定化

标题： GaVS: 3D-Grounded Video Stabilization via Temporally-Consistent Local Reconstruction and Rendering

Zinuo You, Stamatios Georgoulis, Anpei Chen, Siyu Tang, Dengxin Dai

评论： SIGGRAPH 2025，项目网站：https://sinoyou.github.io/gavs

主题：图形学 (cs.GR) ; 计算机视觉与模式识别 (cs.CV)
[3123] arXiv:2506.24000 (交叉列表自 cs.LG) [中文pdf, pdf, html, 其他]: 标题：进步的幻觉？对视觉-语言模型测试时适应的批判性审视

标题： The Illusion of Progress? A Critical Look at Test-Time Adaptation for Vision-Language Models

Lijun Sheng, Jian Liang, Ran He, Zilei Wang, Tieniu Tan

评论： Github链接：https://github.com/TomSheng21/tta-vlm

主题：机器学习 (cs.LG) ; 计算机视觉与模式识别 (cs.CV)
[3124] arXiv:2506.24003 (交叉列表自 eess.IV) [中文pdf, pdf, html, 其他]: 标题：形状工具包

标题： ShapeKit

Junqi Liu, Dongli He, Wenxuan Li, Ningyu Wang, Alan L. Yuille, Zongwei Zhou

主题：图像与视频处理 (eess.IV) ; 计算机视觉与模式识别 (cs.CV)
[3125] arXiv:2506.24016 (交叉列表自 cs.CL) [中文pdf, pdf, html, 其他]: 标题：专家：具有结构化解释的可解释图像字幕评估指标

标题： EXPERT: An Explainable Image Captioning Evaluation Metric with Structured Explanations

Hyunjong Kim, Sangyeop Kim, Jongheon Jeong, Yeongjae Cho, Sungzoon Cho

评论：被ACL 2025收录为发现成果

主题：计算与语言 (cs.CL) ; 人工智能 (cs.AI) ; 计算机视觉与模式识别 (cs.CV)

总共 3129 条目 : 1-25 ... 3026-3050 3051-3075 3076-3100 3101-3125 3126-3129

显示最多 25 每页条目：较少 | 更多 | 所有

计算机视觉与模式识别

2025年06月 的作者和标题

2025年06月的作者和标题