Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > cs.CV

帮助 | 高级搜索

计算机视觉与模式识别

最近提交的作者和标题

  • 2025年07月04日, 星期五
  • 2025年07月03日, 星期四
  • 2025年07月02日, 星期三
  • 2025年07月01日, 星期二
  • 2025年06月30日, 星期一

查看今天的 新的 变化

总共 740 条目 : 1-50 ... 601-650 651-700 701-740 715-740
显示最多 50 每页条目: 较少 | 更多 | 所有

2025年06月30日, 星期一 (继续, 展示 最后 114 之 26 条目 )

[715] arXiv:2506.22222 (交叉列表自 eess.IV) [中文pdf, pdf, html, 其他]
标题: 基于深度学习的先进方法用于B型主动脉夹层的自动分割
标题: Advanced Deep Learning Techniques for Automated Segmentation of Type B Aortic Dissections
Hao Xu, Ruth Lim, Brian E. Chapman
评论: 9页,5图,3表
主题: 图像与视频处理 (eess.IV) ; 计算机视觉与模式识别 (cs.CV)
[716] arXiv:2506.22176 (交叉列表自 cs.RO) [中文pdf, pdf, html, 其他]
标题: KnotDLO:迈向可解释的打结
标题: KnotDLO: Toward Interpretable Knot Tying
Holly Dinkel, Raghavendra Navaratna, Jingyi Xiang, Brian Coltin, Trey Smith, Timothy Bretl
评论: 4页,5张图,在2023年日本横滨举行的IEEE国际机器人与自动化会议的3D视觉表示操作研讨会中发表。视频演示 [https://youtu.be/mg30uCUtpOk]。海报 [https://hollydinkel.github.io/assets/pdf/ICRA20243DVRM_poster.pdf] 3DVRM 研讨会 [https://3d-manipulation-workshop.github.io/]
主题: 机器人技术 (cs.RO) ; 计算机视觉与模式识别 (cs.CV)
[717] arXiv:2506.22156 (交叉列表自 cs.AR) [中文pdf, pdf, html, 其他]
标题: FPGA上用于MRF图重建的超快速神经网络训练的硬件加速
标题: Hardware acceleration for ultra-fast Neural Network training on FPGA for MRF map reconstruction
Mattia Ricchi, Fabrizio Alfonsi, Camilla Marella, Marco Barbieri, Alessandra Retico, Leonardo Brizi, Alessandro Gabrielli, Claudia Testa
评论: 8页,2张图表,将发表在SDPS 2024会议论文集上:2024年国际设计与过程科学学会关于在设计与过程科学中应用人工智能/生成式人工智能的进展与挑战会议
主题: 硬件架构 (cs.AR) ; 计算机视觉与模式识别 (cs.CV) ; 仪器与探测器 (physics.ins-det)
[718] arXiv:2506.22116 (交叉列表自 cs.RO) [中文pdf, pdf, html, 其他]
标题: 评估在人机协作中目标选择的指向手势
标题: Evaluating Pointing Gestures for Target Selection in Human-Robot Collaboration
Noora Sassali, Roel Pieters
评论: 被2025年第34届IEEE国际机器人与人机交互通信会议(RO-MAN)接受。预印本
主题: 机器人技术 (cs.RO) ; 计算机视觉与模式识别 (cs.CV)
[719] arXiv:2506.22041 (交叉列表自 eess.IV) [中文pdf, pdf, html, 其他]
标题: 通过多模态深度学习实现可扩展且稳健的白质病变定位
标题: Towards Scalable and Robust White Matter Lesion Localization via Multimodal Deep Learning
Julia Machnio, Sebastian Nørgaard Llambias, Mads Nielsen, Mostafa Mehdipour Ghazi
评论: 第二届索邦-海德堡医学人工智能研讨会:用于多模态数据的机器学习
主题: 图像与视频处理 (eess.IV) ; 计算机视觉与模式识别 (cs.CV)
[720] arXiv:2506.22012 (交叉列表自 eess.IV) [中文pdf, pdf, html, 其他]
标题: 基于噪声的扩散模型用于可泛化的低剂量CT重建
标题: Noise-Inspired Diffusion Model for Generalizable Low-Dose CT Reconstruction
Qi Gao, Zhihao Chen, Dong Zeng, Junping Zhang, Jianhua Ma, Hongming Shan
评论: 已接受发表于《医学图像分析》,2025年
主题: 图像与视频处理 (eess.IV) ; 计算机视觉与模式识别 (cs.CV)
[721] arXiv:2506.21977 (交叉列表自 eess.IV) [中文pdf, pdf, 其他]
标题: 稳定编解码器:用于极端图像压缩的一步扩散方法
标题: StableCodec: Taming One-Step Diffusion for Extreme Image Compression
Tianyu Zhang, Xin Luo, Li Li, Dong Liu
主题: 图像与视频处理 (eess.IV) ; 计算机视觉与模式识别 (cs.CV)
[722] arXiv:2506.21976 (交叉列表自 cs.LG) [中文pdf, pdf, html, 其他]
标题: SceneDiffuser++:通过生成式世界模型进行城市规模的交通模拟
标题: SceneDiffuser++: City-Scale Traffic Simulation via a Generative World Model
Shuhan Tan, John Lambert, Hong Jeon, Sakshum Kulshrestha, Yijing Bai, Jing Luo, Dragomir Anguelov, Mingxing Tan, Chiyu Max Jiang
评论: 被CVPR 2025接收
主题: 机器学习 (cs.LG) ; 人工智能 (cs.AI) ; 计算机视觉与模式识别 (cs.CV) ; 多智能体系统 (cs.MA) ; 机器人技术 (cs.RO)
[723] arXiv:2506.21934 (交叉列表自 cs.IR) [中文pdf, pdf, html, 其他]
标题: CAL-RAG:内容感知版面设计的检索增强型多智能体生成
标题: CAL-RAG: Retrieval-Augmented Multi-Agent Generation for Content-Aware Layout Design
Najmeh Forouzandehmehr, Reza Yousefi Maragheh, Sriram Kollipara, Kai Zhao, Topojoy Biswas, Evren Korpeoglu, Kannan Achan
主题: 信息检索 (cs.IR) ; 计算机视觉与模式识别 (cs.CV)
[724] arXiv:2506.21884 (交叉列表自 eess.IV) [中文pdf, pdf, html, 其他]
标题: UnMix-NeRF:光谱解混遇见神经辐射场
标题: UnMix-NeRF: Spectral Unmixing Meets Neural Radiance Fields
Fabian Perez, Sara Rojas, Carlos Hinojosa, Hoover Rueda-Chacón, Bernard Ghanem
评论: 论文被ICCV 2025主会议接收
主题: 图像与视频处理 (eess.IV) ; 人工智能 (cs.AI) ; 计算机视觉与模式识别 (cs.CV) ; 机器学习 (cs.LG) ; 信号处理 (eess.SP)
[725] arXiv:2506.21880 (交叉列表自 eess.IV) [中文pdf, pdf, html, 其他]
标题: 基于物理退化模型引导的非干涉超光谱重建与展开变压器
标题: Physical Degradation Model-Guided Interferometric Hyperspectral Reconstruction with Unfolding Transformer
Yuansheng Li, Yunhao Zou, Linwei Chen, Ying Fu
主题: 图像与视频处理 (eess.IV) ; 计算机视觉与模式识别 (cs.CV)
[726] arXiv:2506.21876 (交叉列表自 cs.CL) [中文pdf, pdf, html, 其他]
标题: 视觉语言模型是否有内部世界模型? 面向原子评估
标题: Do Vision-Language Models Have Internal World Models? Towards an Atomic Evaluation
Qiyue Gao, Xinyu Pi, Kevin Liu, Junrong Chen, Ruolan Yang, Xinqi Huang, Xinyu Fang, Lu Sun, Gautham Kishore, Bo Ai, Stone Tao, Mengyang Liu, Jiaxi Yang, Chao-Jung Lai, Chuanyang Jin, Jiannan Xiang, Benhao Huang, Zeming Chen, David Danks, Hao Su, Tianmin Shu, Ziqiao Ma, Lianhui Qin, Zhiting Hu
评论: ACL 2025(成果)
主题: 计算与语言 (cs.CL) ; 人工智能 (cs.AI) ; 计算机视觉与模式识别 (cs.CV)
[727] arXiv:2506.21860 (交叉列表自 cs.RO) [中文pdf, pdf, html, 其他]
标题: 具身领域自适应的目标检测
标题: Embodied Domain Adaptation for Object Detection
Xiangyu Shi, Yanyuan Qiao, Lingqiao Liu, Feras Dayoub
评论: 被IROS 2025接收
主题: 机器人技术 (cs.RO) ; 计算机视觉与模式识别 (cs.CV)
[728] arXiv:2506.21812 (交叉列表自 cs.CL) [中文pdf, pdf, html, 其他]
标题: 迈向透明的人工智能:可解释大型语言模型的综述
标题: Towards Transparent AI: A Survey on Explainable Large Language Models
Avash Palikhe, Zhenyu Yu, Zichong Wang, Wenbin Zhang
主题: 计算与语言 (cs.CL) ; 计算机视觉与模式识别 (cs.CV)
[729] arXiv:2506.21765 (交叉列表自 eess.IV) [中文pdf, pdf, html, 其他]
标题: TUS-REC2024:一种在没有外部跟踪器的情况下重建3D徒手超声的挑战
标题: TUS-REC2024: A Challenge to Reconstruct 3D Freehand Ultrasound Without External Tracker
Qi Li, Shaheer U. Saeed, Yuliang Huang, Mingyuan Luo, Zhongnuo Yan, Jiongquan Chen, Xin Yang, Dong Ni, Nektarios Winter, Phuc Nguyen, Lucas Steinberger, Caelan Haney, Yuan Zhao, Mingjie Jiang, Bowen Ren, SiYeoul Lee, Seonho Kim, MinKyung Seo, MinWoo Kim, Yimeng Dou, Zhiwei Zhang, Yin Li, Tomy Varghese, Dean C. Barratt, Matthew J. Clarkson, Tom Vercauteren, Yipeng Hu
主题: 图像与视频处理 (eess.IV) ; 计算机视觉与模式识别 (cs.CV)
[730] arXiv:2506.21748 (交叉列表自 physics.optics) [中文pdf, pdf, html, 其他]
标题: 基于扩散模型的衍射超表面的逆向设计
标题: Inverse Design of Diffractive Metasurfaces Using Diffusion Models
Liav Hen, Erez Yosef, Dan Raviv, Raja Giryes, Jacob Scheuer
主题: 光学 (physics.optics) ; 计算机视觉与模式识别 (cs.CV) ; 机器学习 (cs.LG)
[731] arXiv:2506.21732 (交叉列表自 cs.RO) [中文pdf, pdf, html, 其他]
标题: 基于滑动转向的视觉导航的姿态感知强化学习实验研究
标题: Experimental investigation of pose informed reinforcement learning for skid-steered visual navigation
Ameya Salvi, Venkat Krovi
主题: 机器人技术 (cs.RO) ; 人工智能 (cs.AI) ; 计算机视觉与模式识别 (cs.CV) ; 机器学习 (cs.LG) ; 系统与控制 (eess.SY)
[732] arXiv:2506.21714 (交叉列表自 cs.LG) [中文pdf, pdf, html, 其他]
标题: 常微分方程$_t$(常微分方程$_l$):在扩散和流模型中缩短时间和长度以实现更快的采样
标题: ODE$_t$(ODE$_l$): Shortcutting the Time and Length in Diffusion and Flow Models for Faster Sampling
Denis Gudovskiy, Wenzhao Zheng, Tomoyuki Okuno, Yohei Nakata, Kurt Keutzer
评论: 预印本。GitHub 页面:github.com/gudovskiy/odelt
主题: 机器学习 (cs.LG) ; 计算机视觉与模式识别 (cs.CV)
[733] arXiv:2506.21680 (交叉列表自 eess.IV) [中文pdf, pdf, html, 其他]
标题: 光子喷溅:从SPAD传感器进行3D场景重建和着色
标题: PhotonSplat: 3D Scene Reconstruction and Colorization from SPAD Sensors
Sai Sri Teja, Sreevidya Chintalapati, Vinayak Gupta, Mukund Varma T, Haejoon Lee, Aswin Sankaranarayanan, Kaushik Mitra
评论: 被国际计算摄影会议(ICCP)2025接受
主题: 图像与视频处理 (eess.IV) ; 计算机视觉与模式识别 (cs.CV)
[734] arXiv:2506.21655 (交叉列表自 cs.LG) [中文pdf, pdf, html, 其他]
标题: APO:通过非对称策略优化增强多模态大语言模型的推理能力
标题: APO: Enhancing Reasoning Ability of MLLMs via Asymmetric Policy Optimization
Minjie Hong, Zirun Guo, Yan Xia, Zehan Wang, Ziang Zhang, Tao Jin, Zhou Zhao
主题: 机器学习 (cs.LG) ; 人工智能 (cs.AI) ; 计算机视觉与模式识别 (cs.CV)
[735] arXiv:2506.21635 (交叉列表自 cs.RO) [中文pdf, pdf, html, 其他]
标题: AeroLite-MDNet:用于无人机着陆的轻量级多任务偏差检测网络
标题: AeroLite-MDNet: Lightweight Multi-task Deviation Detection Network for UAV Landing
Haiping Yang, Huaxing Liu, Wei Wu, Zuohui Chen, Ning Wu
主题: 机器人技术 (cs.RO) ; 人工智能 (cs.AI) ; 计算机视觉与模式识别 (cs.CV)
[736] arXiv:2506.21630 (交叉列表自 cs.RO) [中文pdf, pdf, html, 其他]
标题: TOMD:一种基于路径的非公路多模态数据集,用于在具有挑战性的光照条件下可行驶路径分割
标题: TOMD: A Trail-based Off-road Multimodal Dataset for Traversable Pathway Segmentation under Challenging Illumination Conditions
Yixin Sun, Li Li, Wenke E, Amir Atapour-Abarghouei, Toby P. Breckon
评论: 8页,9图,2025 IJCNN
主题: 机器人技术 (cs.RO) ; 计算机视觉与模式识别 (cs.CV) ; 机器学习 (cs.LG)
[737] arXiv:2506.21604 (交叉列表自 cs.IR) [中文pdf, pdf, html, 其他]
标题: 评估VisualRAG:量化企业文档理解中的跨模态性能
标题: Evaluating VisualRAG: Quantifying Cross-Modal Performance in Enterprise Document Understanding
Varun Mannam, Fang Wang, Xin Chen
评论: 会议:KDD 会议 工作坊: https://kdd-eval-workshop.github.io/genai-evaluation-kdd2025/
主题: 信息检索 (cs.IR) ; 人工智能 (cs.AI) ; 计算机视觉与模式识别 (cs.CV) ; 人机交互 (cs.HC) ; 机器学习 (cs.LG)
[738] arXiv:2506.21601 (交叉列表自 cs.IR) [中文pdf, pdf, html, 其他]
标题: 基于层次化补丁压缩的 ColPali:具有动态剪枝和量化高效多向量文档检索
标题: Hierarchical Patch Compression for ColPali: Efficient Multi-Vector Document Retrieval with Dynamic Pruning and Quantization
Duong Bach
评论: 9页
主题: 信息检索 (cs.IR) ; 计算机视觉与模式识别 (cs.CV)
[739] arXiv:2506.21592 (交叉列表自 cs.CL) [中文pdf, pdf, html, 其他]
标题: SignBart -- 用于孤立手语识别的新方法与骨架序列
标题: SignBart -- New approach with the skeleton sequence for Isolated Sign language Recognition
Tinh Nguyen, Minh Khue Phan Tran
主题: 计算与语言 (cs.CL) ; 计算机视觉与模式识别 (cs.CV)
[740] arXiv:2506.21586 (交叉列表自 cs.CL) [中文pdf, pdf, html, 其他]
标题: 视觉语言模型能理解模仿动作吗?
标题: Can Vision Language Models Understand Mimed Actions?
Hyundong Cho, Spencer Lin, Tejas Srinivasan, Michael Saxon, Deuksin Kwon, Natali T. Chavez, Jonathan May
评论: ACL 2025 论文集
主题: 计算与语言 (cs.CL) ; 人工智能 (cs.AI) ; 计算机视觉与模式识别 (cs.CV)
总共 740 条目 : 1-50 ... 601-650 651-700 701-740 715-740
显示最多 50 每页条目: 较少 | 更多 | 所有
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号