计算机视觉与模式识别

最近提交的作者和标题

查看今天的新的变化

总共 740 条目 : 1-50 ... 601-650 651-700 701-740 715-740

显示最多 50 每页条目：较少 | 更多 | 所有

[715] arXiv:2506.22222 (交叉列表自 eess.IV) [中文pdf, pdf, html, 其他]: 标题：基于深度学习的先进方法用于B型主动脉夹层的自动分割

标题： Advanced Deep Learning Techniques for Automated Segmentation of Type B Aortic Dissections

Hao Xu, Ruth Lim, Brian E. Chapman

评论： 9页，5图，3表

主题：图像与视频处理 (eess.IV) ; 计算机视觉与模式识别 (cs.CV)
[716] arXiv:2506.22176 (交叉列表自 cs.RO) [中文pdf, pdf, html, 其他]: 标题： KnotDLO：迈向可解释的打结

标题： KnotDLO: Toward Interpretable Knot Tying

Holly Dinkel, Raghavendra Navaratna, Jingyi Xiang, Brian Coltin, Trey Smith, Timothy Bretl

评论： 4页，5张图，在2023年日本横滨举行的IEEE国际机器人与自动化会议的3D视觉表示操作研讨会中发表。视频演示 [https://youtu.be/mg30uCUtpOk]。海报 [https://hollydinkel.github.io/assets/pdf/ICRA20243DVRM_poster.pdf] 3DVRM 研讨会 [https://3d-manipulation-workshop.github.io/]

主题：机器人技术 (cs.RO) ; 计算机视觉与模式识别 (cs.CV)
[717] arXiv:2506.22156 (交叉列表自 cs.AR) [中文pdf, pdf, html, 其他]: 标题： FPGA上用于MRF图重建的超快速神经网络训练的硬件加速

标题： Hardware acceleration for ultra-fast Neural Network training on FPGA for MRF map reconstruction

Mattia Ricchi, Fabrizio Alfonsi, Camilla Marella, Marco Barbieri, Alessandra Retico, Leonardo Brizi, Alessandro Gabrielli, Claudia Testa

评论： 8页，2张图表，将发表在SDPS 2024会议论文集上：2024年国际设计与过程科学学会关于在设计与过程科学中应用人工智能/生成式人工智能的进展与挑战会议

主题：硬件架构 (cs.AR) ; 计算机视觉与模式识别 (cs.CV) ; 仪器与探测器 (physics.ins-det)
[718] arXiv:2506.22116 (交叉列表自 cs.RO) [中文pdf, pdf, html, 其他]: 标题：评估在人机协作中目标选择的指向手势

标题： Evaluating Pointing Gestures for Target Selection in Human-Robot Collaboration

Noora Sassali, Roel Pieters

评论：被2025年第34届IEEE国际机器人与人机交互通信会议（RO-MAN）接受。预印本

主题：机器人技术 (cs.RO) ; 计算机视觉与模式识别 (cs.CV)
[719] arXiv:2506.22041 (交叉列表自 eess.IV) [中文pdf, pdf, html, 其他]: 标题：通过多模态深度学习实现可扩展且稳健的白质病变定位

标题： Towards Scalable and Robust White Matter Lesion Localization via Multimodal Deep Learning

Julia Machnio, Sebastian Nørgaard Llambias, Mads Nielsen, Mostafa Mehdipour Ghazi

评论：第二届索邦-海德堡医学人工智能研讨会：用于多模态数据的机器学习

主题：图像与视频处理 (eess.IV) ; 计算机视觉与模式识别 (cs.CV)
[720] arXiv:2506.22012 (交叉列表自 eess.IV) [中文pdf, pdf, html, 其他]: 标题：基于噪声的扩散模型用于可泛化的低剂量CT重建

标题： Noise-Inspired Diffusion Model for Generalizable Low-Dose CT Reconstruction

Qi Gao, Zhihao Chen, Dong Zeng, Junping Zhang, Jianhua Ma, Hongming Shan

评论：已接受发表于《医学图像分析》，2025年

主题：图像与视频处理 (eess.IV) ; 计算机视觉与模式识别 (cs.CV)
[721] arXiv:2506.21977 (交叉列表自 eess.IV) [中文pdf, pdf, 其他]: 标题：稳定编解码器：用于极端图像压缩的一步扩散方法

标题： StableCodec: Taming One-Step Diffusion for Extreme Image Compression

Tianyu Zhang, Xin Luo, Li Li, Dong Liu

主题：图像与视频处理 (eess.IV) ; 计算机视觉与模式识别 (cs.CV)
[722] arXiv:2506.21976 (交叉列表自 cs.LG) [中文pdf, pdf, html, 其他]: 标题： SceneDiffuser++：通过生成式世界模型进行城市规模的交通模拟

标题： SceneDiffuser++: City-Scale Traffic Simulation via a Generative World Model

Shuhan Tan, John Lambert, Hong Jeon, Sakshum Kulshrestha, Yijing Bai, Jing Luo, Dragomir Anguelov, Mingxing Tan, Chiyu Max Jiang

评论：被CVPR 2025接收

主题：机器学习 (cs.LG) ; 人工智能 (cs.AI) ; 计算机视觉与模式识别 (cs.CV) ; 多智能体系统 (cs.MA) ; 机器人技术 (cs.RO)
[723] arXiv:2506.21934 (交叉列表自 cs.IR) [中文pdf, pdf, html, 其他]: 标题： CAL-RAG：内容感知版面设计的检索增强型多智能体生成

标题： CAL-RAG: Retrieval-Augmented Multi-Agent Generation for Content-Aware Layout Design

Najmeh Forouzandehmehr, Reza Yousefi Maragheh, Sriram Kollipara, Kai Zhao, Topojoy Biswas, Evren Korpeoglu, Kannan Achan

主题：信息检索 (cs.IR) ; 计算机视觉与模式识别 (cs.CV)
[724] arXiv:2506.21884 (交叉列表自 eess.IV) [中文pdf, pdf, html, 其他]: 标题： UnMix-NeRF：光谱解混遇见神经辐射场

标题： UnMix-NeRF: Spectral Unmixing Meets Neural Radiance Fields

Fabian Perez, Sara Rojas, Carlos Hinojosa, Hoover Rueda-Chacón, Bernard Ghanem

评论：论文被ICCV 2025主会议接收

主题：图像与视频处理 (eess.IV) ; 人工智能 (cs.AI) ; 计算机视觉与模式识别 (cs.CV) ; 机器学习 (cs.LG) ; 信号处理 (eess.SP)
[725] arXiv:2506.21880 (交叉列表自 eess.IV) [中文pdf, pdf, html, 其他]: 标题：基于物理退化模型引导的非干涉超光谱重建与展开变压器

标题： Physical Degradation Model-Guided Interferometric Hyperspectral Reconstruction with Unfolding Transformer

Yuansheng Li, Yunhao Zou, Linwei Chen, Ying Fu

主题：图像与视频处理 (eess.IV) ; 计算机视觉与模式识别 (cs.CV)
[726] arXiv:2506.21876 (交叉列表自 cs.CL) [中文pdf, pdf, html, 其他]: 标题：视觉语言模型是否有内部世界模型？面向原子评估

标题： Do Vision-Language Models Have Internal World Models? Towards an Atomic Evaluation

Qiyue Gao, Xinyu Pi, Kevin Liu, Junrong Chen, Ruolan Yang, Xinqi Huang, Xinyu Fang, Lu Sun, Gautham Kishore, Bo Ai, Stone Tao, Mengyang Liu, Jiaxi Yang, Chao-Jung Lai, Chuanyang Jin, Jiannan Xiang, Benhao Huang, Zeming Chen, David Danks, Hao Su, Tianmin Shu, Ziqiao Ma, Lianhui Qin, Zhiting Hu

评论： ACL 2025（成果）

主题：计算与语言 (cs.CL) ; 人工智能 (cs.AI) ; 计算机视觉与模式识别 (cs.CV)
[727] arXiv:2506.21860 (交叉列表自 cs.RO) [中文pdf, pdf, html, 其他]: 标题：具身领域自适应的目标检测

标题： Embodied Domain Adaptation for Object Detection

Xiangyu Shi, Yanyuan Qiao, Lingqiao Liu, Feras Dayoub

评论：被IROS 2025接收

主题：机器人技术 (cs.RO) ; 计算机视觉与模式识别 (cs.CV)
[728] arXiv:2506.21812 (交叉列表自 cs.CL) [中文pdf, pdf, html, 其他]: 标题：迈向透明的人工智能：可解释大型语言模型的综述

标题： Towards Transparent AI: A Survey on Explainable Large Language Models

Avash Palikhe, Zhenyu Yu, Zichong Wang, Wenbin Zhang

主题：计算与语言 (cs.CL) ; 计算机视觉与模式识别 (cs.CV)
[729] arXiv:2506.21765 (交叉列表自 eess.IV) [中文pdf, pdf, html, 其他]: 标题： TUS-REC2024：一种在没有外部跟踪器的情况下重建3D徒手超声的挑战

标题： TUS-REC2024: A Challenge to Reconstruct 3D Freehand Ultrasound Without External Tracker

Qi Li, Shaheer U. Saeed, Yuliang Huang, Mingyuan Luo, Zhongnuo Yan, Jiongquan Chen, Xin Yang, Dong Ni, Nektarios Winter, Phuc Nguyen, Lucas Steinberger, Caelan Haney, Yuan Zhao, Mingjie Jiang, Bowen Ren, SiYeoul Lee, Seonho Kim, MinKyung Seo, MinWoo Kim, Yimeng Dou, Zhiwei Zhang, Yin Li, Tomy Varghese, Dean C. Barratt, Matthew J. Clarkson, Tom Vercauteren, Yipeng Hu

主题：图像与视频处理 (eess.IV) ; 计算机视觉与模式识别 (cs.CV)
[730] arXiv:2506.21748 (交叉列表自 physics.optics) [中文pdf, pdf, html, 其他]: 标题：基于扩散模型的衍射超表面的逆向设计

标题： Inverse Design of Diffractive Metasurfaces Using Diffusion Models

Liav Hen, Erez Yosef, Dan Raviv, Raja Giryes, Jacob Scheuer

主题：光学 (physics.optics) ; 计算机视觉与模式识别 (cs.CV) ; 机器学习 (cs.LG)
[731] arXiv:2506.21732 (交叉列表自 cs.RO) [中文pdf, pdf, html, 其他]: 标题：基于滑动转向的视觉导航的姿态感知强化学习实验研究

标题： Experimental investigation of pose informed reinforcement learning for skid-steered visual navigation

Ameya Salvi, Venkat Krovi

主题：机器人技术 (cs.RO) ; 人工智能 (cs.AI) ; 计算机视觉与模式识别 (cs.CV) ; 机器学习 (cs.LG) ; 系统与控制 (eess.SY)
[732] arXiv:2506.21714 (交叉列表自 cs.LG) [中文pdf, pdf, html, 其他]: 标题：常微分方程$_t$(常微分方程$_l$)：在扩散和流模型中缩短时间和长度以实现更快的采样

标题： ODE$_t$(ODE$_l$): Shortcutting the Time and Length in Diffusion and Flow Models for Faster Sampling

Denis Gudovskiy, Wenzhao Zheng, Tomoyuki Okuno, Yohei Nakata, Kurt Keutzer

评论：预印本。GitHub 页面：github.com/gudovskiy/odelt

主题：机器学习 (cs.LG) ; 计算机视觉与模式识别 (cs.CV)
[733] arXiv:2506.21680 (交叉列表自 eess.IV) [中文pdf, pdf, html, 其他]: 标题：光子喷溅：从SPAD传感器进行3D场景重建和着色

标题： PhotonSplat: 3D Scene Reconstruction and Colorization from SPAD Sensors

Sai Sri Teja, Sreevidya Chintalapati, Vinayak Gupta, Mukund Varma T, Haejoon Lee, Aswin Sankaranarayanan, Kaushik Mitra

评论：被国际计算摄影会议（ICCP）2025接受

主题：图像与视频处理 (eess.IV) ; 计算机视觉与模式识别 (cs.CV)
[734] arXiv:2506.21655 (交叉列表自 cs.LG) [中文pdf, pdf, html, 其他]: 标题： APO：通过非对称策略优化增强多模态大语言模型的推理能力

标题： APO: Enhancing Reasoning Ability of MLLMs via Asymmetric Policy Optimization

Minjie Hong, Zirun Guo, Yan Xia, Zehan Wang, Ziang Zhang, Tao Jin, Zhou Zhao

主题：机器学习 (cs.LG) ; 人工智能 (cs.AI) ; 计算机视觉与模式识别 (cs.CV)
[735] arXiv:2506.21635 (交叉列表自 cs.RO) [中文pdf, pdf, html, 其他]: 标题： AeroLite-MDNet：用于无人机着陆的轻量级多任务偏差检测网络

标题： AeroLite-MDNet: Lightweight Multi-task Deviation Detection Network for UAV Landing

Haiping Yang, Huaxing Liu, Wei Wu, Zuohui Chen, Ning Wu

主题：机器人技术 (cs.RO) ; 人工智能 (cs.AI) ; 计算机视觉与模式识别 (cs.CV)
[736] arXiv:2506.21630 (交叉列表自 cs.RO) [中文pdf, pdf, html, 其他]: 标题： TOMD：一种基于路径的非公路多模态数据集，用于在具有挑战性的光照条件下可行驶路径分割

标题： TOMD: A Trail-based Off-road Multimodal Dataset for Traversable Pathway Segmentation under Challenging Illumination Conditions

Yixin Sun, Li Li, Wenke E, Amir Atapour-Abarghouei, Toby P. Breckon

评论： 8页，9图，2025 IJCNN

主题：机器人技术 (cs.RO) ; 计算机视觉与模式识别 (cs.CV) ; 机器学习 (cs.LG)
[737] arXiv:2506.21604 (交叉列表自 cs.IR) [中文pdf, pdf, html, 其他]: 标题：评估VisualRAG：量化企业文档理解中的跨模态性能

标题： Evaluating VisualRAG: Quantifying Cross-Modal Performance in Enterprise Document Understanding

Varun Mannam, Fang Wang, Xin Chen

评论：会议：KDD 会议工作坊： https://kdd-eval-workshop.github.io/genai-evaluation-kdd2025/

主题：信息检索 (cs.IR) ; 人工智能 (cs.AI) ; 计算机视觉与模式识别 (cs.CV) ; 人机交互 (cs.HC) ; 机器学习 (cs.LG)
[738] arXiv:2506.21601 (交叉列表自 cs.IR) [中文pdf, pdf, html, 其他]: 标题：基于层次化补丁压缩的 ColPali：具有动态剪枝和量化高效多向量文档检索

标题： Hierarchical Patch Compression for ColPali: Efficient Multi-Vector Document Retrieval with Dynamic Pruning and Quantization

Duong Bach

评论： 9页

主题：信息检索 (cs.IR) ; 计算机视觉与模式识别 (cs.CV)
[739] arXiv:2506.21592 (交叉列表自 cs.CL) [中文pdf, pdf, html, 其他]: 标题： SignBart -- 用于孤立手语识别的新方法与骨架序列

标题： SignBart -- New approach with the skeleton sequence for Isolated Sign language Recognition

Tinh Nguyen, Minh Khue Phan Tran

主题：计算与语言 (cs.CL) ; 计算机视觉与模式识别 (cs.CV)
[740] arXiv:2506.21586 (交叉列表自 cs.CL) [中文pdf, pdf, html, 其他]: 标题：视觉语言模型能理解模仿动作吗？

标题： Can Vision Language Models Understand Mimed Actions?

Hyundong Cho, Spencer Lin, Tejas Srinivasan, Michael Saxon, Deuksin Kwon, Natali T. Chavez, Jonathan May

评论： ACL 2025 论文集

主题：计算与语言 (cs.CL) ; 人工智能 (cs.AI) ; 计算机视觉与模式识别 (cs.CV)

总共 740 条目 : 1-50 ... 601-650 651-700 701-740 715-740

显示最多 50 每页条目：较少 | 更多 | 所有

计算机视觉与模式识别

最近提交的作者和标题

2025年06月30日， 星期一 (继续， 展示 最后 114 之 26 条目 )

2025年06月30日，星期一 (继续，展示最后 114 之 26 条目 )