Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > cs.CV

帮助 | 高级搜索

计算机视觉与模式识别

最近提交的作者和标题

  • 2025年07月11日, 星期五
  • 2025年07月10日, 星期四
  • 2025年07月09日, 星期三
  • 2025年07月08日, 星期二
  • 2025年07月04日, 星期五

查看今天的 新的 变化

总共 754 条目 : 1-50 ... 301-350 351-400 401-450 428-477 451-500 501-550 551-600 ... 751-754
显示最多 50 每页条目: 较少 | 更多 | 所有

2025年07月08日, 星期二 (继续, 展示 328 之 50 条目 )

[428] arXiv:2507.04369 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: MambaFusion:多模态3D目标检测的高保真密集全局融合
标题: MambaFusion: Height-Fidelity Dense Global Fusion for Multi-modal 3D Object Detection
Hanshi Wang, Jin Gao, Weiming Hu, Zhipeng Zhang
评论: 10页
期刊参考: ICCV 2025
主题: 计算机视觉与模式识别 (cs.CV)
[429] arXiv:2507.04333 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 基于跨模态特征图的计算机断层扫描视觉问答
标题: Computed Tomography Visual Question Answering with Cross-modal Feature Graphing
Yuanhe Tian, Chen Su, Junwen Duan, Yan Song
评论: 9页,3图
主题: 计算机视觉与模式识别 (cs.CV) ; 计算与语言 (cs.CL)
[430] arXiv:2507.04323 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: DMAT:一种用于联合大气湍流抑制和目标检测的端到端框架
标题: DMAT: An End-to-End Framework for Joint Atmospheric Turbulence Mitigation and Object Detection
Paul Hill, Alin Achim, Dave Bull, Nantheera Anantrasirichai
主题: 计算机视觉与模式识别 (cs.CV)
[431] arXiv:2507.04306 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 探索夜间动态光照条件下远程生理信号测量:数据集、实验与分析
标题: Exploring Remote Physiological Signal Measurement under Dynamic Lighting Conditions at Night: Dataset, Experiment, and Analysis
Zhipeng Li, Kegang Wang, Hanguang Xiao, Xingyue Liu, Feizhong Zhou, Jiaxin Jiang, Tianqi Liu
主题: 计算机视觉与模式识别 (cs.CV)
[432] arXiv:2507.04302 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 基于李雅普诺夫指数引导优化的单领域泛化对抗数据增强
标题: Adversarial Data Augmentation for Single Domain Generalization via Lyapunov Exponent-Guided Optimization
Zuyu Zhang, Ning Chen, Yongshan Liu, Qinghua Zhang, Xu Zhang
评论: 被ICCV 2025接收
主题: 计算机视觉与模式识别 (cs.CV) ; 机器学习 (cs.LG)
[433] arXiv:2507.04290 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: MPQ-DMv2:具有时间蒸馏的低比特扩散模型的灵活残差混合精度量化
标题: MPQ-DMv2: Flexible Residual Mixed Precision Quantization for Low-Bit Diffusion Models with Temporal Distillation
Weilun Feng, Chuanguang Yang, Haotong Qin, Yuqi Li, Xiangqi Li, Zhulin An, Libo Huang, Boyu Diao, Fuzhen Zhuang, Michele Magno, Yongjun Xu, Yingli Tian, Tingwen Huang
主题: 计算机视觉与模式识别 (cs.CV)
[434] arXiv:2507.04289 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: M$^3$-Med:医学教学视频理解中的多语言、多模态和多跳推理基准
标题: M$^3$-Med: A Benchmark for Multi-lingual, Multi-modal, and Multi-hop Reasoning in Medical Instructional Video Understanding
Shenxi Liu, Kan Li, Mingyang Zhao, Yuhang Tian, Bin Li, Shoujun Zhou, Hongliang Li, Fuxia Yang
评论: 19页,8图,7表
主题: 计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI)
[435] arXiv:2507.04285 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: SeqTex:在视频序列中生成网格纹理
标题: SeqTex: Generate Mesh Textures in Video Sequence
Ze Yuan (1), Xin Yu (1), Yangtian Sun (1), Yuan-Chen Guo (2), Yan-Pei Cao (2), Ding Liang (2), Xiaojuan Qi (1) ((1) HKU, (2) VAST)
主题: 计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI) ; 图形学 (cs.GR)
[436] arXiv:2507.04277 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 面向移动设备的最轻量低光图像增强架构
标题: Towards Lightest Low-Light Image Enhancement Architecture for Mobile Devices
Guangrui Bai, Hailong Yan, Wenhai Liu, Yahui Deng, Erbao Dong
评论: 提交至ESWA
主题: 计算机视觉与模式识别 (cs.CV)
[437] arXiv:2507.04270 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: ZERO:基于多模态提示的视觉定位
标题: ZERO: Multi-modal Prompt-based Visual Grounding
Sangbum Choi, Kyeongryeol Go
评论: CVPR2025基础少样本目标检测挑战赛解决方案报告
主题: 计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI)
[438] arXiv:2507.04269 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 使用引导频谱数据选择的深度网络高效训练:迈向学习所需内容的一步
标题: Efficient Training of Deep Networks using Guided Spectral Data Selection: A Step Toward Learning What You Need
Mohammadreza Sharifi, Ahad Harati
评论: 19页,10幅图,正在Springer的《数据挖掘与知识发现》期刊审稿中,提交于2025年4月
主题: 计算机视觉与模式识别 (cs.CV) ; 机器学习 (cs.LG)
[439] arXiv:2507.04258 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: MoReMouse:单目实验鼠重建
标题: MoReMouse: Monocular Reconstruction of Laboratory Mouse
Yuan Zhong, Jingxiang Sun, Liang An, Yebin Liu
主题: 计算机视觉与模式识别 (cs.CV)
[440] arXiv:2507.04243 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 可泛化的领域人像风格迁移
标题: Domain Generalizable Portrait Style Transfer
Xinbo Wang, Wenju Xu, Qing Zhang, Wei-Shi Zheng
评论: 被ICCV 2025接收
主题: 计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI)
[441] arXiv:2507.04218 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: DreamPoster:一种图像条件生成海报设计的统一框架
标题: DreamPoster: A Unified Framework for Image-Conditioned Generative Poster Design
Xiwei Hu, Haokun Chen, Zhongqi Qi, Hui Zhang, Dexiang Hong, Jie Shao, Xinglong Wu
主题: 计算机视觉与模式识别 (cs.CV)
[442] arXiv:2507.04207 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 零样本基于扩散的图像恢复的快速绕过机制
标题: Quick Bypass Mechanism of Zero-Shot Diffusion-Based Image Restoration
Yu-Shan Tai, An-Yeu (Andy)Wu
主题: 计算机视觉与模式识别 (cs.CV)
[443] arXiv:2507.04190 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 面向空间变化的增益和分箱
标题: Towards Spatially-Varying Gain and Binning
Anqi Yang, Eunhee Kang, Wei Chen, Hyong-Euk Lee, Aswin C. Sankaranarayanan
主题: 计算机视觉与模式识别 (cs.CV) ; 图像与视频处理 (eess.IV)
[444] arXiv:2507.04183 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 从单视角进入无界动态场景
标题: Voyaging into Unbounded Dynamic Scenes from a Single View
Fengrui Tian, Tianjiao Ding, Jinqi Luo, Hancheng Min, René Vidal
评论: 被国际计算机视觉会议(ICCV)2025接受。 项目页面:https://tianfr.github.io/DynamicVoyager
主题: 计算机视觉与模式识别 (cs.CV)
[445] arXiv:2507.04152 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: LVLM-Composer 的图像生成显式规划
标题: LVLM-Composer's Explicit Planning for Image Generation
Spencer Ramsey, Jeffrey Lee, Amina Grant
主题: 计算机视觉与模式识别 (cs.CV)
[446] arXiv:2507.04151 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 解锁组合控制:基于LVLM的图像生成自监督方法
标题: Unlocking Compositional Control: Self-Supervision for LVLM-Based Image Generation
Fernando Gabriela Garcia, Spencer Burns, Ryan Shaw, Hunter Young
主题: 计算机视觉与模式识别 (cs.CV)
[447] arXiv:2507.04141 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 通过视觉-语言基础模型进行行人意图预测
标题: Pedestrian Intention Prediction via Vision-Language Foundation Models
Mohsen Azarmi, Mahdi Rezaei, He Wang
主题: 计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI) ; 新兴技术 (cs.ET) ; 机器学习 (cs.LG) ; 机器人技术 (cs.RO)
[448] arXiv:2507.04139 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: Driver-Net:用于评估自动驾驶车辆驾驶员接管准备性的多摄像头融合
标题: Driver-Net: Multi-Camera Fusion for Assessing Driver Take-Over Readiness in Automated Vehicles
Mahdi Rezaei, Mohsen Azarmi
评论: 8页,4图,4表。已被IEEE IV 2025接收
主题: 计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI) ; 新兴技术 (cs.ET) ; 机器学习 (cs.LG) ; 机器人技术 (cs.RO)
[449] arXiv:2507.04123 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 面向自动驾驶的准确高效三维物体检测:边缘上的专家计算系统
标题: Towards Accurate and Efficient 3D Object Detection for Autonomous Driving: A Mixture of Experts Computing System on Edge
Linshen Liu, Boyan Su, Junyue Jiang, Guanlin Wu, Cong Guo, Ceyu Xu, Hao Frank Yang
评论: 被ICCV 2025接受
主题: 计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI)
[450] arXiv:2507.04118 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: PromptSR:轻量级图像超分辨率的级联提示
标题: PromptSR: Cascade Prompting for Lightweight Image Super-Resolution
Wenyang Liu, Chen Cai, Jianjun Gao, Kejun Wu, Yi Wang, Kim-Hui Yap, Lap-Pui Chau
评论: 已接受于TMM
主题: 计算机视觉与模式识别 (cs.CV)
[451] arXiv:2507.04116 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 用于鲁棒和自适应多目标跟踪的集成高斯过程
标题: Integrated Gaussian Processes for Robust and Adaptive Multi-Object Tracking
Fred Lydeard, Bashar I. Ahmad, Simon Godsill
评论: 18页,5图,提交至IEEE航空航天与电子系统汇刊
主题: 计算机视觉与模式识别 (cs.CV) ; 应用 (stat.AP) ; 方法论 (stat.ME)
[452] arXiv:2507.04107 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: VICI:VLM指导的跨视图图像定位
标题: VICI: VLM-Instructed Cross-view Image-localisation
Xiaohan Zhang, Tavis Shore, Chen Chen, Oscar Mendez, Simon Hadfield, Safwan Wshah
主题: 计算机视觉与模式识别 (cs.CV)
[453] arXiv:2507.04062 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 带有动作转换和动作特征记忆的随机人类运动预测
标题: Stochastic Human Motion Prediction with Memory of Action Transition and Action Characteristic
Jianwei Tang, Hong Yang, Tengyue Chen, Jian-Fang Hu
评论: 被CVPR 2025接受
期刊参考: 计算机视觉与模式识别会议论文集。2025:1883-1893
主题: 计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI)
[454] arXiv:2507.04061 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 一致且不变的短视频虚假信息检测学习
标题: Consistent and Invariant Generalization Learning for Short-video Misinformation Detection
Hanghui Guo, Weijie Shi, Mengze Li, Juncheng Li, Hao Chen, Yue Cui, Jiajie Xu, Jia Zhu, Jiawei Shen, Zhangze Chen, Sirui Han
评论: 被ACM MM 2025接受,15页,16图
主题: 计算机视觉与模式识别 (cs.CV) ; 多媒体 (cs.MM)
[455] arXiv:2507.04060 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 时间持续学习与先验补偿的人体运动预测
标题: Temporal Continual Learning with Prior Compensation for Human Motion Prediction
Jianwei Tang, Jiangxin Sun, Xiaotong Lin, Lifang Zhang, Wei-Shi Zheng, Jian-Fang Hu
评论: 神经信息处理系统大会2023
期刊参考: 神经信息处理系统进展,2023年,36:65837-65849
主题: 计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI)
[456] arXiv:2507.04051 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 生成、精炼和编码:利用合成新样本进行实时细粒度类别发现
标题: Generate, Refine, and Encode: Leveraging Synthesized Novel Samples for On-the-Fly Fine-Grained Category Discovery
Xiao Liu, Nan Pu, Haiyang Zheng, Wenjing Li, Nicu Sebe, Zhun Zhong
评论: ICCV 2025
主题: 计算机视觉与模式识别 (cs.CV)
[457] arXiv:2507.04049 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 打破模仿瓶颈:强化扩散推动多样化轨迹生成
标题: Breaking Imitation Bottlenecks: Reinforced Diffusion Powers Diverse Trajectory Generation
Ziying Song, Lin Liu, Hongyu Pan, Bencheng Liao, Mingzhe Guo, Lei Yang, Yongchang Zhang, Shaoqing Xu, Caiyan Jia, Yadan Luo
评论: 16页,6图
主题: 计算机视觉与模式识别 (cs.CV) ; 机器人技术 (cs.RO)
[458] arXiv:2507.04047 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 移动以理解三维场景:连接视觉定位和探索以实现高效且多用途的具身导航
标题: Move to Understand a 3D Scene: Bridging Visual Grounding and Exploration for Efficient and Versatile Embodied Navigation
Ziyu Zhu, Xilin Wang, Yixuan Li, Zhuofan Zhang, Xiaojian Ma, Yixin Chen, Baoxiong Jia, Wei Liang, Qian Yu, Zhidong Deng, Siyuan Huang, Qing Li
评论: 具身人工智能;三维视觉语言理解
主题: 计算机视觉与模式识别 (cs.CV)
[459] arXiv:2507.04038 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: T-SYNTH:基于知识的合成乳腺图像数据集
标题: T-SYNTH: A Knowledge-Based Dataset of Synthetic Breast Images
Christopher Wiedeman, Anastasiia Sarmakeeva, Elena Sizikova, Daniil Filienko, Miguel Lago, Jana G. Delfino, Aldo Badano
主题: 计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI)
[460] arXiv:2507.04036 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: PresentAgent:用于演示视频生成的多模态代理
标题: PresentAgent: Multimodal Agent for Presentation Video Generation
Jingwei Shi, Zeyu Zhang, Biao Wu, Yanjie Liang, Meng Fang, Ling Chen, Yang Zhao
主题: 计算机视觉与模式识别 (cs.CV)
[461] arXiv:2507.04020 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 探索在视觉变压器中使用柯尔莫哥洛夫- Arnold 网络扩展以减轻持续学习中的灾难性遗忘
标题: Exploring Kolmogorov-Arnold Network Expansions in Vision Transformers for Mitigating Catastrophic Forgetting in Continual Learning
Zahid Ullah, Jihie Kim
主题: 计算机视觉与模式识别 (cs.CV)
[462] arXiv:2507.04017 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 从地面级别图像使用深度神经网络进行栖息地分类
标题: Habitat Classification from Ground-Level Imagery Using Deep Neural Networks
Hongrui Shi, Lisa Norton, Lucy Ridding, Simon Rolph, Tom August, Claire M Wood, Lan Qie, Petra Bosilj, James M Brown
评论: 26页,12图,6表
主题: 计算机视觉与模式识别 (cs.CV)
[463] arXiv:2507.04006 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 组内缩放与正交分解用于人脸反欺骗中的领域不变特征提取
标题: Group-wise Scaling and Orthogonal Decomposition for Domain-Invariant Feature Extraction in Face Anti-Spoofing
Seungjin Jung, Kanghee Lee, Yonghyun Jeong, Haeun Noh, Jungmin Lee, Jongwon Choi
评论: 发表于ICCV 2025。代码将在https://github.com/SeungjinJung/GD-FAS上提供。
主题: 计算机视觉与模式识别 (cs.CV)
[464] arXiv:2507.04002 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: NRSeg:通过驾驶世界模型进行BEV语义分割的噪声鲁棒学习
标题: NRSeg: Noise-Resilient Learning for BEV Semantic Segmentation via Driving World Models
Siyu Li, Fei Teng, Yihong Cao, Kailun Yang, Zhiyong Li, Yaonan Wang
评论: 源代码将在 https://github.com/lynn-yu/NRSeg 公开发布
主题: 计算机视觉与模式识别 (cs.CV) ; 机器人技术 (cs.RO) ; 图像与视频处理 (eess.IV)
[465] arXiv:2507.03990 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: LEHA-CVQAD:用于实现压缩伪影广义视频质量评估的数据集
标题: LEHA-CVQAD: Dataset To Enable Generalized Video Quality Assessment of Compression Artifacts
Aleksandr Gushchin, Maksim Smirnov, Dmitriy Vatolin, Anastasia Antsiferova
主题: 计算机视觉与模式识别 (cs.CV)
[466] arXiv:2507.03984 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: CoT-Segmenter:通过思维链推理增强密集道路场景中的异常检测
标题: CoT-Segmenter: Enhancing OOD Detection in Dense Road Scenes via Chain-of-Thought Reasoning
Jeonghyo Song, Kimin Yun, DaeUng Jo, Jinyoung Kim, Youngjoon Yoo
评论: 6页,3图
主题: 计算机视觉与模式识别 (cs.CV)
[467] arXiv:2507.03979 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 通量雕塑者:通过分解空间流控制的文本驱动的丰富属性人像编辑
标题: Flux-Sculptor: Text-Driven Rich-Attribute Portrait Editing through Decomposed Spatial Flow Control
Tianyao He, Runqi Wang, Yang Chen, Dejia Song, Nemo Chen, Xu Tang, Yao Hu
评论: 17页,17图
主题: 计算机视觉与模式识别 (cs.CV)
[468] arXiv:2507.03976 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 通过光照过渡的鲁棒低光场景恢复
标题: Robust Low-light Scene Restoration via Illumination Transition
Ze Li, Feng Zhang, Xiatian Zhu, Meng Zhang, Yanghong Zhou, P. Y. Mok
评论: 10页,5图
主题: 计算机视觉与模式识别 (cs.CV)
[469] arXiv:2507.03953 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 评估扩散个性化中的对抗保护:一项全面研究
标题: Evaluating Adversarial Protections for Diffusion Personalization: A Comprehensive Study
Kai Ye, Tianyi Chen, Zhen Wang
评论: 被接受至ICML 2025的第二届可靠与负责任基础模型研讨会(R2-FM 2025)。8页,3图
主题: 计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI)
[470] arXiv:2507.03938 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: VISC:使用普遍的视觉惯性监督进行毫米波雷达场景流估计
标题: VISC: mmWave Radar Scene Flow Estimation using Pervasive Visual-Inertial Supervision
Kezhong Liu, Yiwen Zhou, Mozi Chen, Jianhua He, Jingao Xu, Zheng Yang, Chris Xiaoxuan Lu, Shengkai Zhang
主题: 计算机视觉与模式识别 (cs.CV) ; 机器人技术 (cs.RO)
[471] arXiv:2507.03936 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 基于外部注意力的人类交互识别自适应节点选择学习
标题: Learning Adaptive Node Selection with External Attention for Human Interaction Recognition
Chen Pang, Xuequan Lu, Qianyu Zhou, Lei Lyu
评论: 被ACM MM25接受
主题: 计算机视觉与模式识别 (cs.CV)
[472] arXiv:2507.03924 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: DNF-Intrinsic:室内逆渲染的确定性无噪声扩散
标题: DNF-Intrinsic: Deterministic Noise-Free Diffusion for Indoor Inverse Rendering
Rongjia Zheng, Qing Zhang, Chengjiang Long, Wei-Shi Zheng
主题: 计算机视觉与模式识别 (cs.CV)
[473] arXiv:2507.03923 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 学习解耦的染色和结构表示用于半监督组织病理学分割
标题: Learning Disentangled Stain and Structural Representations for Semi-Supervised Histopathology Segmentation
Ha-Hieu Pham, Nguyen Lan Vi Vu, Thanh-Huy Nguyen, Ulas Bagci, Min Xu, Trung-Nghia Le, Huy-Hieu Pham
主题: 计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI)
[474] arXiv:2507.03908 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 连接视觉与语言:通过大语言模型进行最优传输驱动的放射学报告生成
标题: Bridging Vision and Language: Optimal Transport-Driven Radiology Report Generation via LLMs
Haifeng Zhao, Yufei Zhang, Leilei Ma, Shuo Xu, Dengdi Sun
主题: 计算机视觉与模式识别 (cs.CV)
[475] arXiv:2507.03905 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: EchoMimicV3:1.3B 参数是统一多模态和多任务人类动画所需的一切
标题: EchoMimicV3: 1.3B Parameters are All You Need for Unified Multi-Modal and Multi-Task Human Animation
Rang Meng, Yan Wang, Weipeng Wu, Ruobing Zheng, Yuming Li, Chenguang Ma
主题: 计算机视觉与模式识别 (cs.CV)
[476] arXiv:2507.03903 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 利用下采样-上采样网络消除异常:用于3D异常检测的组中心保持重建
标题: Taming Anomalies with Down-Up Sampling Networks: Group Center Preserving Reconstruction for 3D Anomaly Detection
Hanzhe Liang, Jie Zhang, Tao Dai, Linlin Shen, Jinbao Wang, Can Gao
评论: ACM MM25 接受
期刊参考: 第33届ACM国际多媒体会议2025
主题: 计算机视觉与模式识别 (cs.CV)
[477] arXiv:2507.03898 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 通过具有早期分叉的双分支框架进行去混淆因果推理用于基于传感器的跨域活动识别
标题: Deconfounding Causal Inference through Two-Branch Framework with Early-Forking for Sensor-Based Cross-Domain Activity Recognition
Di Xiong, Lei Zhang, Shuoyuan Wang, Dongzhou Cheng, Wenbo Huang
评论: 被ACM人机交互、移动、可穿戴和普适技术会议论文集(IMWUT)接受
期刊参考: 程序集 ACM 交互式 移动 可穿戴 普遍技术 9, 2, 文章 56 (2025 年 6 月)
主题: 计算机视觉与模式识别 (cs.CV)
总共 754 条目 : 1-50 ... 301-350 351-400 401-450 428-477 451-500 501-550 551-600 ... 751-754
显示最多 50 每页条目: 较少 | 更多 | 所有
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号