Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > cs.CV

帮助 | 高级搜索

计算机视觉与模式识别

最近提交的作者和标题

  • 2025年07月22日, 星期二
  • 2025年07月21日, 星期一
  • 2025年07月18日, 星期五
  • 2025年07月17日, 星期四
  • 2025年07月16日, 星期三

查看今天的 新的 变化

总共 610 条目 : 1-50 51-100 101-150 151-200 ... 601-610
显示最多 50 每页条目: 较少 | 更多 | 所有

2025年07月22日, 星期二 (展示 首先 189 之 50 条目 )

[1] arXiv:2507.15856 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 潜在去噪使视觉分词器表现良好
标题: Latent Denoising Makes Good Visual Tokenizers
Jiawei Yang, Tianhong Li, Lijie Fan, Yonglong Tian, Yue Wang
评论: 代码可在以下地址获得:https://github.com/Jiawei-Yang/DeTok
主题: 计算机视觉与模式识别 (cs.CV)
[2] arXiv:2507.15852 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: SeC:通过渐进概念构建推进复杂视频对象分割
标题: SeC: Advancing Complex Video Object Segmentation via Progressive Concept Construction
Zhixiong Zhang, Shuangrui Ding, Xiaoyi Dong, Songxin He, Jianfan Lin, Junsong Tang, Yuhang Zang, Yuhang Cao, Dahua Lin, Jiaqi Wang
评论: 项目页面:https://rookiexiong7.github.io/projects/SeC/;代码:https://github.com/OpenIXCLab/SeC;数据集:https://huggingface.co/datasets/OpenIXCLab/SeCVOS
主题: 计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI)
[3] arXiv:2507.15824 (交叉列表自 cs.CV) [中文pdf, pdf, 其他]
标题: 你的模型能用一个水瓶分离蛋黄吗? 视频生成模型中物理常识理解的基准测试
标题: Can Your Model Separate Yolks with a Water Bottle? Benchmarking Physical Commonsense Understanding in Video Generation Models
Enes Sanli, Baris Sarper Tezcan, Aykut Erdem, Erkut Erdem
主题: 计算机视觉与模式识别 (cs.CV)
[4] arXiv:2507.15809 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 多变量地下生成的扩散模型和高效概率反演
标题: Diffusion models for multivariate subsurface generation and efficient probabilistic inversion
Roberto Miele, Niklas Linde
主题: 计算机视觉与模式识别 (cs.CV) ; 机器学习 (cs.LG) ; 地球物理 (physics.geo-ph) ; 应用 (stat.AP)
[5] arXiv:2507.15807 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 真正的多模态上下文学习需要关注视觉上下文
标题: True Multimodal In-Context Learning Needs Attention to the Visual Context
Shuo Chen, Jianzhe Liu, Zhen Han, Yan Xia, Daniel Cremers, Philip Torr, Volker Tresp, Jindong Gu
评论: 被COLM 2025接受
主题: 计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI)
[6] arXiv:2507.15803 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: ConformalSAM:使用共形预测在半监督语义分割中释放基础分割模型的潜力
标题: ConformalSAM: Unlocking the Potential of Foundational Segmentation Models in Semi-Supervised Semantic Segmentation with Conformal Prediction
Danhui Chen, Ziquan Liu, Chuxi Yang, Dan Wang, Yan Yan, Yi Xu, Xiangyang Ji
评论: ICCV 2025
主题: 计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI) ; 机器学习 (cs.LG)
[7] arXiv:2507.15798 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 探索最先进的低参数视觉模型中的叠加和干涉
标题: Exploring Superposition and Interference in State-of-the-Art Low-Parameter Vision Models
Lilian Hollard, Lucas Mohimont, Nathalie Gaveau, Luiz-Angelo Steffenel
期刊参考: 加拿大人工智能协会(2025)
主题: 计算机视觉与模式识别 (cs.CV)
[8] arXiv:2507.15793 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 基于正则化低秩适应的少样本器官分割
标题: Regularized Low-Rank Adaptation for Few-Shot Organ Segmentation
Ghassen Baklouti, Julio Silva-Rodríguez, Jose Dolz, Houda Bahig, Ismail Ben Ayed
评论: 被MICCAI 2025接收
主题: 计算机视觉与模式识别 (cs.CV)
[9] arXiv:2507.15777 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 标签树语义损失用于丰富的多类医学图像分割
标题: Label tree semantic losses for rich multi-class medical image segmentation
Junwen Wang, Oscar MacCormac, William Rochford, Aaron Kujawa, Jonathan Shapey, Tom Vercauteren
评论: arXiv管理员备注:与arXiv:2506.21150存在文本重叠
主题: 计算机视觉与模式识别 (cs.CV)
[10] arXiv:2507.15765 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 从异质性中学习:通过分布鲁棒优化推广动态面部表情识别
标题: Learning from Heterogeneity: Generalizing Dynamic Facial Expression Recognition via Distributionally Robust Optimization
Feng-Qi Cui, Anyang Tong, Jinyang Huang, Jie Zhang, Dan Guo, Zhi Liu, Meng Wang
评论: 被ACM MM'25接受
主题: 计算机视觉与模式识别 (cs.CV)
[11] arXiv:2507.15748 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 通过基于变压器的双侧网格预测实现外观一致性
标题: Appearance Harmonization via Bilateral Grid Prediction with Transformers for 3DGS
Jisu Shin, Richard Shaw, Seunghyun Shin, Anton Pelykh, Zhensong Zhang, Hae-Gon Jeon, Eduardo Perez-Pellitero
评论: 10页,3张图,正在NeurIPS 2025审稿中
主题: 计算机视觉与模式识别 (cs.CV)
[12] arXiv:2507.15728 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: TokensGen:利用压缩标记进行长视频生成
标题: TokensGen: Harnessing Condensed Tokens for Long Video Generation
Wenqi Ouyang, Zeqi Xiao, Danni Yang, Yifan Zhou, Shuai Yang, Lei Yang, Jianlou Si, Xingang Pan
评论: 项目页面:https://vicky0522.github.io/tokensgen-webpage/
主题: 计算机视觉与模式识别 (cs.CV)
[13] arXiv:2507.15724 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 基于Transformer的空间控制图像生成实用研究
标题: A Practical Investigation of Spatially-Controlled Image Generation with Transformers
Guoxuan Xia, Harleen Hanspal, Petru-Daniel Tudosiu, Shifeng Zhang, Sarah Parisot
评论: 预印本
主题: 计算机视觉与模式识别 (cs.CV)
[14] arXiv:2507.15709 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 通过自训练和知识蒸馏的高效人脸图像质量评估
标题: Efficient Face Image Quality Assessment via Self-training and Knowledge Distillation
Wei Sun, Weixia Zhang, Linhan Cao, Jun Jia, Xiangyang Zhu, Dandan Zhu, Xiongkuo Min, Guangtao Zhai
评论: Efficient-FIQA在ICCV VQualA 2025面部图像质量评估挑战赛中获得第一名
主题: 计算机视觉与模式识别 (cs.CV)
[15] arXiv:2507.15690 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: DWTGS:重新思考稀疏视图3D高斯点云的频率正则化
标题: DWTGS: Rethinking Frequency Regularization for Sparse-view 3D Gaussian Splatting
Hung Nguyen, Runfa Li, An Le, Truong Nguyen
评论: 6页,4图
主题: 计算机视觉与模式识别 (cs.CV) ; 图像与视频处理 (eess.IV) ; 信号处理 (eess.SP)
[16] arXiv:2507.15686 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: LINR-PCGC:点云几何压缩的无损隐式神经表示
标题: LINR-PCGC: Lossless Implicit Neural Representations for Point Cloud Geometry Compression
Wenjie Huang, Qi Yang, Shuting Xia, He Huang, Zhu Li, Yiling Xu
评论: 被ICCV 2025接收
主题: 计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI)
[17] arXiv:2507.15683 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: Hi^2-GSLoc:面向遥感的双层次高斯特定视觉重定位
标题: Hi^2-GSLoc: Dual-Hierarchical Gaussian-Specific Visual Relocalization for Remote Sensing
Boni Hu, Zhenyu Xia, Lin Chen, Pengcheng Han, Shuhui Bu
评论: 17页,11图
主题: 计算机视觉与模式识别 (cs.CV)
[18] arXiv:2507.15680 (交叉列表自 cs.CV) [中文pdf, pdf, 其他]
标题: 视觉-语言模型知识蒸馏方法用于图像质量评估
标题: Visual-Language Model Knowledge Distillation Method for Image Quality Assessment
Yongkang Hou, Jiarun Song
主题: 计算机视觉与模式识别 (cs.CV)
[19] arXiv:2507.15655 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: HW-MLVQA:通过全面的VQA基准阐明多语言手写文档理解
标题: HW-MLVQA: Elucidating Multilingual Handwritten Document Understanding with a Comprehensive VQA Benchmark
Aniket Pal, Ajoy Mondal, Minesh Mathew, C.V. Jawahar
评论: 这是提交给IJDAR的原始论文的次要修改版本
主题: 计算机视觉与模式识别 (cs.CV)
[20] arXiv:2507.15652 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 从中间层提取视觉事实以减轻多模态大语言模型中的幻觉
标题: Extracting Visual Facts from Intermediate Layers for Mitigating Hallucinations in Multimodal Large Language Models
Haoran Zhou, Zihan Zhang, Hao Chen
主题: 计算机视觉与模式识别 (cs.CV)
[21] arXiv:2507.15636 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 通过彩票假设揭示深度伪造检测的关键特征
标题: Uncovering Critical Features for Deepfake Detection through the Lottery Ticket Hypothesis
Lisan Al Amin, Md. Ismail Hossain, Thanh Thi Nguyen, Tasnim Jahan, Mahbubul Islam, Faisal Quader
评论: 已接受发表于2025年IEEE系统、人与控制论国际会议(SMC)
主题: 计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI)
[22] arXiv:2507.15633 (交叉列表自 cs.CV) [中文pdf, pdf, 其他]
标题: 在中世纪音乐手稿中进行主动学习和顺序学习的实验
标题: Experimenting active and sequential learning in a medieval music manuscript
Sachin Sharma (GSSI), Federico Simonetta (GSSI), Michele Flammini (GSSI)
评论: 6页,4图,已被IEEE MLSP 2025(IEEE机器学习信号处理国际研讨会)接收。专题会议:人工智能在文化与艺术遗产中的应用
主题: 计算机视觉与模式识别 (cs.CV)
[23] arXiv:2507.15628 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 基于DNN的视频分析能效优化技术综述:过程系统、算法与应用
标题: A Survey on Efficiency Optimization Techniques for DNN-based Video Analytics: Process Systems, Algorithms, and Applications
Shanjiang Tang, Rui Huang, Hsinyu Luo, Chunjiang Wang, Ce Yu, Yusen Li, Hao Fu, Chao Sun, and Jian Xiao
主题: 计算机视觉与模式识别 (cs.CV)
[24] arXiv:2507.15606 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 圆柱面:用于三维感知图像生成的嵌套圆柱表示
标题: CylinderPlane: Nested Cylinder Representation for 3D-aware Image Generation
Ru Jia, Xiaozhuang Ma, Jianji Wang, Nanning Zheng
评论: 5页,4图,待发表
主题: 计算机视觉与模式识别 (cs.CV)
[25] arXiv:2507.15602 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 表面点云:连接表面重建和高斯点云
标题: SurfaceSplat: Connecting Surface Reconstruction and Gaussian Splatting
Zihui Gao, Jia-Wang Bian, Guosheng Lin, Hao Chen, Chunhua Shen
主题: 计算机视觉与模式识别 (cs.CV)
[26] arXiv:2507.15597 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 存在-H0:从大规模人类视频进行视觉-语言-动作预训练
标题: Being-H0: Vision-Language-Action Pretraining from Large-Scale Human Videos
Hao Luo, Yicheng Feng, Wanpeng Zhang, Sipeng Zheng, Ye Wang, Haoqi Yuan, Jiazheng Liu, Chaoyi Xu, Qin Jin, Zongqing Lu
评论: 37页
主题: 计算机视觉与模式识别 (cs.CV) ; 机器学习 (cs.LG) ; 机器人技术 (cs.RO)
[27] arXiv:2507.15595 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: SegDT:一种基于扩散变压器的医学影像分割模型
标题: SegDT: A Diffusion Transformer-Based Segmentation Model for Medical Imaging
Salah Eddine Bekhouche, Gaby Maroun, Fadi Dornaika, Abdenour Hadid
主题: 计算机视觉与模式识别 (cs.CV)
[28] arXiv:2507.15578 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 压缩-对齐-检测:从未注册图像中进行在线变化检测
标题: Compress-Align-Detect: onboard change detection from unregistered images
Gabriele Inzerillo, Diego Valsesia, Aniello Fiengo, Enrico Magli
主题: 计算机视觉与模式识别 (cs.CV) ; 图像与视频处理 (eess.IV)
[29] arXiv:2507.15577 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: GeMix:基于条件GAN的混合方法用于改进医学图像增强
标题: GeMix: Conditional GAN-Based Mixup for Improved Medical Image Augmentation
Hugo Carlesso, Maria Eliza Patulea, Moncef Garouani, Radu Tudor Ionescu, Josiane Mothe
主题: 计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI) ; 机器学习 (cs.LG)
[30] arXiv:2507.15569 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: DynImg:带有视觉提示的关键帧是多模态视频理解的良好表示
标题: DynImg: Key Frames with Visual Prompts are Good Representation for Multi-Modal Video Understanding
Xiaoyi Bao, Chenwei Xie, Hao Tang, Tingyu Weng, Xiaofeng Wang, Yun Zheng, Xingang Wang
评论: 被ICCV 2025接受
主题: 计算机视觉与模式识别 (cs.CV)
[31] arXiv:2507.15542 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: HOLa:具有低秩分解VLM特征适应的零样本HOI检测
标题: HOLa: Zero-Shot HOI Detection with Low-Rank Decomposed VLM Feature Adaptation
Qinqian Lei, Bo Wang, Robby T. Tan
评论: 被ICCV 2025接收
主题: 计算机视觉与模式识别 (cs.CV)
[32] arXiv:2507.15541 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 面向整体的外科场景图
标题: Towards Holistic Surgical Scene Graph
Jongmin Shin, Enki Cho, Ka Yong Kim, Jung Yong Kim, Seong Tae Kim, Namkee Oh
评论: 被MICCAI 2025接收
主题: 计算机视觉与模式识别 (cs.CV)
[33] arXiv:2507.15540 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 通过正则化Gromov-Wasserstein最优传输的程序学习
标题: Procedure Learning via Regularized Gromov-Wasserstein Optimal Transport
Syed Ahmed Mahmood, Ali Shah Ali, Umer Ahmed, Fawad Javed Fateh, M. Zeeshan Zia, Quoc-Huy Tran
主题: 计算机视觉与模式识别 (cs.CV)
[34] arXiv:2507.15520 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: SAIGFormer:一种空间自适应光照引导网络用于低光图像增强
标题: SAIGFormer: A Spatially-Adaptive Illumination-Guided Network for Low-Light Image Enhancement
Hanting Li, Fei Zhou, Xin Sun, Yang Hua, Jungong Han, Liang-Jie Zhang
评论: 11页,10图,6表
主题: 计算机视觉与模式识别 (cs.CV)
[35] arXiv:2507.15504 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 量化与缩小未知:通过不确定性最小化进行的交互式文本到视频检索
标题: Quantifying and Narrowing the Unknown: Interactive Text-to-Video Retrieval via Uncertainty Minimization
Bingqing Zhang, Zhuo Cao, Heming Du, Yang Li, Xue Li, Jiajun Liu, Sen Wang
评论: 被ICCV 2025接受
主题: 计算机视觉与模式识别 (cs.CV)
[36] arXiv:2507.15496 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 密集深度图引导的稀疏点云和图像深度激光雷达-视觉里程计
标题: Dense-depth map guided deep Lidar-Visual Odometry with Sparse Point Clouds and Images
JunYing Huang, Ao Xu, DongSun Yong, KeRen Li, YuanFeng Wang, Qi Qin
主题: 计算机视觉与模式识别 (cs.CV) ; 机器学习 (cs.LG) ; 机器人技术 (cs.RO)
[37] arXiv:2507.15492 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 用于复杂森林地形搜索任务的航拍彩色图像异常数据集
标题: An aerial color image anomaly dataset for search missions in complex forested terrain
Rakesh John Amala Arokia Nathan, Matthias Gessner, Nurullah Özkan, Marius Bock, Mohamed Youssef, Maximilian Mews, Björn Piltz, Ralf Berger, Oliver Bimber
评论: 17页
主题: 计算机视觉与模式识别 (cs.CV)
[38] arXiv:2507.15480 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 最后一则关于您的视觉-语言模型的提醒
标题: One Last Attention for Your Vision-Language Model
Liang Chen, Ghazi Shazan Ahmad, Tianjun Yao, Lingqiao Liu, Zhiqiang Shen
评论: 被ICCV 2025接受
主题: 计算机视觉与模式识别 (cs.CV)
[39] arXiv:2507.15428 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: EgoPrune:用于具身智能体自我运动视频推理的高效标记剪枝
标题: EgoPrune: Efficient Token Pruning for Egomotion Video Reasoning in Embodied Agent
Jiaao Li, Kaiyuan Li, Chen Gao, Yong Li, Xinlei Chen
主题: 计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI)
[40] arXiv:2507.15418 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: SurgX:可解释手术阶段识别的神经元-概念关联
标题: SurgX: Neuron-Concept Association for Explainable Surgical Phase Recognition
Ka Young Kim, Hyeon Bae Kim, Seong Tae Kim
评论: 被MICCAI 2025接收
主题: 计算机视觉与模式识别 (cs.CV)
[41] arXiv:2507.15401 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 重新思考FER中的遮挡:一种语义感知的视角并超越
标题: Rethinking Occlusion in FER: A Semantic-Aware Perspective and Go Beyond
Huiyu Zhai, Xingxing Yang, Yalan Ye, Chenyang Li, Bin Fan, Changze Li
主题: 计算机视觉与模式识别 (cs.CV)
[42] arXiv:2507.15365 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: DAViD:从合成数据中获得的高效且准确的视觉模型
标题: DAViD: Data-efficient and Accurate Vision Models from Synthetic Data
Fatemeh Saleh, Sadegh Aliakbarian, Charlie Hewitt, Lohit Petikam, Xiao-Xian, Antonio Criminisi, Thomas J. Cashman, Tadas Baltrušaitis
评论: 被ICCV 2025接收
主题: 计算机视觉与模式识别 (cs.CV)
[43] arXiv:2507.15346 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: RoadFusion:用于路面缺陷检测的潜在扩散模型
标题: RoadFusion: Latent Diffusion Model for Pavement Defect Detection
Muhammad Aqeel, Kidus Dagnaw Bellete, Francesco Setti
评论: 被ICIAP 2025接收
主题: 计算机视觉与模式识别 (cs.CV)
[44] arXiv:2507.15335 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: ExDD:通过扩散合成进行表面缺陷检测的显式双分布学习
标题: ExDD: Explicit Dual Distribution Learning for Surface Defect Detection via Diffusion Synthesis
Muhammad Aqeel, Federico Leonardi, Francesco Setti
评论: 被ICIAP 2025接收
主题: 计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI)
[45] arXiv:2507.15321 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 基准深度:我们是否在正确的方式上评估深度基础模型?
标题: BenchDepth: Are We on the Right Way to Evaluate Depth Foundation Models?
Zhenyu Li, Haotong Lin, Jiashi Feng, Peter Wonka, Bingyi Kang
评论: 网页:https://zhyever.github.io/benchdepth
主题: 计算机视觉与模式识别 (cs.CV)
[46] arXiv:2507.15308 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 通过空间-通道状态空间模型的少样本目标检测
标题: Few-Shot Object Detection via Spatial-Channel State Space Model
Zhimeng Xin, Tianxu Wu, Yixiong Zou, Shiming Chen, Dingjie Fu, Xinge You
主题: 计算机视觉与模式识别 (cs.CV)
[47] arXiv:2507.15297 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 基于细节点的局部密集表示用于指纹匹配
标题: Minutiae-Anchored Local Dense Representation for Fingerprint Matching
Zhiyu Pan, Xiongjun Guan, Yongjie Duan, Jianjiang Feng, Jie Zhou
评论: 正在审核中
主题: 计算机视觉与模式识别 (cs.CV)
[48] arXiv:2507.15285 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 基于上下文学习的视觉语言模型在检测针对人脸识别系统的物理和数字攻击中的应用
标题: In-context Learning of Vision Language Models for Detection of Physical and Digital Attacks against Face Recognition Systems
Lazaro Janier Gonzalez-Soler, Maciej Salwowski, Christoph Busch
评论: 提交至IEEE-TIFS
主题: 计算机视觉与模式识别 (cs.CV)
[49] arXiv:2507.15269 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 针对高效视频压缩的条件视频生成
标题: Conditional Video Generation for High-Efficiency Video Compression
Fangqiu Yi, Jingyu Xu, Jiawei Shao, Chi Zhang, Xuelong Li
主题: 计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI)
[50] arXiv:2507.15257 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: MinCD-PnP:通过近似盲PnP学习2D-3D对应关系
标题: MinCD-PnP: Learning 2D-3D Correspondences with Approximate Blind PnP
Pei An, Jiaqi Yang, Muyao Peng, You Yang, Qiong Liu, Xiaolin Wu, Liangliang Nan
评论: 被ICCV 2025接受
主题: 计算机视觉与模式识别 (cs.CV)
总共 610 条目 : 1-50 51-100 101-150 151-200 ... 601-610
显示最多 50 每页条目: 较少 | 更多 | 所有
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号