Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > cs.DB

帮助 | 高级搜索

数据库

最近提交的作者和标题

  • 2025年06月02日, 星期一
  • 2025年05月30日, 星期五
  • 2025年05月29日, 星期四
  • 2025年05月28日, 星期三
  • 2025年05月27日, 星期二

查看今天的 新的 变化

总共 42 条目
显示最多 50 每页条目: 较少 | 更多 | 所有

2025年06月02日, 星期一 (展示 6 之 6 条目 )

[1] arXiv:2505.24758 (交叉列表自 cs.DB) [中文pdf, pdf, 其他]
标题: 调查:图数据库
标题: Survey: Graph Databases
Miguel E. Coimbra, Lucie Svitáková, Alexandre P. Francisco, Luís Veiga
评论: 47页,1幅图,5张表格
主题: 数据库 (cs.DB) ; 分布式、并行与集群计算 (cs.DC)
[2] arXiv:2505.24716 (交叉列表自 cs.DB) [中文pdf, pdf, html, 其他]
标题: 利用大型语言模型实现可扩展的模式映射
标题: Towards Scalable Schema Mapping using Large Language Models
Christopher Buss, Mahdis Safari, Arash Termehchy, Stefan Lee, David Maier
主题: 数据库 (cs.DB) ; 人工智能 (cs.AI)
[3] arXiv:2505.24312 (交叉列表自 cs.DB) [中文pdf, pdf, html, 其他]
标题: SSCard:使用后缀树引导的 learned FM-索引的子串基数估计
标题: SSCard: Substring Cardinality Estimation using Suffix Tree-Guided Learned FM-Index
Yirui Zhan, Wen Nie, Jun Gao
评论: 15页,10幅图,9张表格
主题: 数据库 (cs.DB)
[4] arXiv:2505.24221 (交叉列表自 cs.DB) [中文pdf, pdf, html, 其他]
标题: FOCUS:通过分层数据管理提升KV存储的模式感知访问
标题: FOCUS: Boosting Schema-aware Access for KV Stores via Hierarchical Data Management
Zhen Liu, Wenzhe Zhu, Yongkun Li, Yinlong Xu
主题: 数据库 (cs.DB)
[5] arXiv:2505.24090 (交叉列表自 cs.DB) [中文pdf, pdf, html, 其他]
标题: 使用生成式人工智能搜索临床数据
标题: Searching Clinical Data Using Generative AI
Karan Hanswadkar, Anika Kanchi, Shivani Tripathi, Shi Qiao, Rony Chatterjee, Alekh Jindal
主题: 数据库 (cs.DB) ; 人工智能 (cs.AI)
[6] arXiv:2505.24063 (交叉列表自 cs.CL) [中文pdf, pdf, 其他]
标题: TCM-Ladder:一个用于中医多模态问答的基准测试集
标题: TCM-Ladder: A Benchmark for Multimodal Question Answering on Traditional Chinese Medicine
Jiacheng Xie, Yang Yu, Ziyang Zhang, Shuai Zeng, Jiaxuan He, Ayush Vasireddy, Xiaoting Tang, Congyu Guo, Lening Zhao, Congcong Jing, Guanghui An, Dong Xu
评论: 22页,4幅图
主题: 计算与语言 (cs.CL) ; 数据库 (cs.DB)

2025年05月30日, 星期五 (展示 5 之 5 条目 )

[7] arXiv:2505.23624 (交叉列表自 cs.DB) [中文pdf, pdf, html, 其他]
标题: 可解释顺序学习
标题: Towards Explainable Sequential Learning
Giacomo Bergami, Emma Packer, Kirsty Scott, Silvia Del Din
主题: 数据库 (cs.DB) ; 人工智能 (cs.AI)
[8] arXiv:2505.23416 (交叉列表自 cs.DB) [中文pdf, pdf, 其他]
标题: KVzip:与上下文重构的查询无关的KV缓存压缩
标题: KVzip: Query-Agnostic KV Cache Compression with Context Reconstruction
Jang-Hyun Kim, Jinuk Kim, Sangwoo Kwon, Jae W. Lee, Sangdoo Yun, Hyun Oh Song
评论: 预印本
主题: 数据库 (cs.DB) ; 机器学习 (cs.LG)
[9] arXiv:2505.23133 (交叉列表自 cs.DB) [中文pdf, pdf, html, 其他]
标题: LINEAGEX:一种用于SQL的列血缘提取系统
标题: LINEAGEX: A Column Lineage Extraction System for SQL
Shi Heng Zhang, Zhengjie Miao, Jiannan Wang
评论: 第41届IEEE数据工程国际会议(ICDE)演示轨道论文集,2025年
主题: 数据库 (cs.DB)
[10] arXiv:2505.23039 (交叉列表自 cs.DB) [中文pdf, pdf, html, 其他]
标题: TailorSQL:专为您查询工作负载定制的NL2SQL系统
标题: TailorSQL: An NL2SQL System Tailored to Your Query Workload
Kapil Vaidya, Jialin Ding, Sebastian Kosak, David Kernert, Chuan Lei, Xiao Qin, Abhinav Tripathy, Ramesh Balan, Balakrishnan Narayanaswamy, Tim Kraska
主题: 数据库 (cs.DB) ; 计算与语言 (cs.CL)
[11] arXiv:2505.22993 (交叉列表自 cs.CL) [中文pdf, pdf, html, 其他]
标题: 基于图验证:使用交互式图表示的复杂声明验证实体消歧增强
标题: Verify-in-the-Graph: Entity Disambiguation Enhancement for Complex Claim Verification with Interactive Graph Representation
Hoang Pham, Thanh-Do Nguyen, Khac-Hoai Nam Bui
评论: 发表于2025年NAACL主会议
期刊参考: https://aclanthology.org/2025.naacl-long.268
主题: 计算与语言 (cs.CL) ; 人工智能 (cs.AI) ; 数据库 (cs.DB) ; 信息检索 (cs.IR)

2025年05月29日, 星期四 (展示 8 之 8 条目 )

[12] arXiv:2505.22349 (交叉列表自 cs.DB) [中文pdf, pdf, html, 其他]
标题: ChatPD:一种基于LLM的论文-数据集网络系统
标题: ChatPD: An LLM-driven Paper-Dataset Networking System
Anjie Xu, Ruiqing Ding, Leye Wang
评论: 已被KDD应用数据科学赛道2025接受
主题: 数据库 (cs.DB) ; 人工智能 (cs.AI) ; 信息检索 (cs.IR)
[13] arXiv:2505.21860 (交叉列表自 cs.DB) [中文pdf, pdf, html, 其他]
标题: GXJoin:可解释连接性的广义单元变换
标题: GXJoin: Generalized Cell Transformations for Explainable Joinability
Soroush Omidvartehrani, Arash Dargahi Nobari, Davood Rafiei
评论: 会议:数据库与信息系统进展国际会议(ADBIS 2024)
主题: 数据库 (cs.DB)
[14] arXiv:2505.21801 (交叉列表自 cs.DB) [中文pdf, pdf, html, 其他]
标题: 查询,而非训练:通过SQL查询实现EHR数据的隐私保护表预测
标题: Query, Don't Train: Privacy-Preserving Tabular Prediction from EHR Data via SQL Queries
Josefa Lia Stoisser, Marc Boubnovski Martell, Kaspar Märtens, Lawrence Phillips, Stephen Michael Town, Rory Donovan-Maiye, Julien Fauqueur
主题: 数据库 (cs.DB)
[15] arXiv:2505.21575 (交叉列表自 cs.DB) [中文pdf, pdf, html, 其他]
标题: StreamLink:基于大型语言模型的分布式数据工程系统
标题: StreamLink: Large-Language-Model Driven Distributed Data Engineering System
Dawei Feng, Di Mei, Huiri Tan, Lei Ren, Xianying Lou, Zhangxi Tan
评论: 已被CIKM Workshop 2024接受,https://sites.google.com/view/cikm2024-rag/papers?authuser=0#h.ddm5fg2z885t
主题: 数据库 (cs.DB) ; 人工智能 (cs.AI)
[16] arXiv:2505.21506 (交叉列表自 cs.DB) [中文pdf, pdf, html, 其他]
标题: 符合性检查少一点:长事件序列的有效符合性检查
标题: Conformance Checking for Less: Efficient Conformance Checking for Long Event Sequences
Eli Bogdanov, Izack Cohen, Avigdor Gal
评论: 17页,4幅图
主题: 数据库 (cs.DB) ; 人工智能 (cs.AI) ; 编程语言 (cs.PL)
[17] arXiv:2505.22571 (交叉列表自 cs.CL) [中文pdf, pdf, html, 其他]
标题: Agent-UniRAG:用于统一检索增强生成系统的可训练开源LLM代理框架
标题: Agent-UniRAG: A Trainable Open-Source LLM Agent Framework for Unified Retrieval-Augmented Generation Systems
Hoang Pham, Thuy-Duong Nguyen, Khac-Hoai Nam Bui
主题: 计算与语言 (cs.CL) ; 人工智能 (cs.AI) ; 数据库 (cs.DB) ; 信息检索 (cs.IR)
[18] arXiv:2505.22552 (交叉列表自 cs.CL) [中文pdf, pdf, html, 其他]
标题: ClaimPKG:通过轻量级专业化LLM的伪子图生成增强声称验证
标题: ClaimPKG: Enhancing Claim Verification via Pseudo-Subgraph Generation with Lightweight Specialized LLM
Hoang Pham, Thanh-Do Nguyen, Khac-Hoai Nam Bui
评论: 被ACL 2025接受的研究发现
期刊参考: ACL 2025
主题: 计算与语言 (cs.CL) ; 人工智能 (cs.AI) ; 数据库 (cs.DB)
[19] arXiv:2505.21866 (交叉列表自 eess.SP) [中文pdf, pdf, html, 其他]
标题: CSI-Bench:一个大规模真实环境数据集用于多任务WiFi感知
标题: CSI-Bench: A Large-Scale In-the-Wild Dataset for Multi-task WiFi Sensing
Guozhen Zhu, Yuqian Hu, Weihang Gao, Wei-Hsiang Wang, Beibei Wang, K. J. Ray Liu
评论: 21页,4幅图
主题: 信号处理 (eess.SP) ; 人工智能 (cs.AI) ; 数据库 (cs.DB)

2025年05月28日, 星期三 (展示 6 之 6 条目 )

[20] arXiv:2505.21459 (交叉列表自 cs.DB) [中文pdf, pdf, html, 其他]
标题: LazyVLM:视频分析的神经符号方法
标题: LazyVLM: Neuro-Symbolic Approach to Video Analytics
Xiangru Jian, Wei Pang, Zhengyuan Dong, Chao Zhang, M. Tamer Özsu
评论: 5页,2幅图,工作论文
主题: 数据库 (cs.DB) ; 人工智能 (cs.AI) ; 计算机视觉与模式识别 (cs.CV) ; 信息检索 (cs.IR) ; 多媒体 (cs.MM)
[21] arXiv:2505.20949 (交叉列表自 cs.DB) [中文pdf, pdf, html, 其他]
标题: 使用PyRML简化知识图谱创建
标题: Streamlining Knowledge Graph Creation with PyRML
Andrea Giovanni Nuzzolese
主题: 数据库 (cs.DB) ; 人工智能 (cs.AI)
[22] arXiv:2505.20683 (交叉列表自 cs.DB) [中文pdf, pdf, html, 其他]
标题: 内存中增量维护来源速写[扩展版本]
标题: In-memory Incremental Maintenance of Provenance Sketches [extended version]
Pengyuan Li, Boris Glavic, Dieter Gawlick, Vasudha Krishnaswamy, Zhen Hua Liu, Danica Porobic, Xing Niu
主题: 数据库 (cs.DB)
[23] arXiv:2505.21409 (交叉列表自 cs.CL) [中文pdf, pdf, 其他]
标题: RelationalFactQA:评估大型语言模型从表格中检索事实的基准
标题: RelationalFactQA: A Benchmark for Evaluating Tabular Fact Retrieval from Large Language Models
Dario Satriani, Enzo Veltri, Donatello Santoro, Paolo Papotti
主题: 计算与语言 (cs.CL) ; 人工智能 (cs.AI) ; 数据库 (cs.DB)
[24] arXiv:2505.21329 (交叉列表自 cs.IR) [中文pdf, pdf, html, 其他]
标题: 数据湖中的鱼腥味:表格联合搜索基准的批判性再评估
标题: Something's Fishy In The Data Lake: A Critical Re-evaluation of Table Union Search Benchmarks
Allaa Boutaleb, Bernd Amann, Hubert Naacke, Rafael Angarita
评论: 已被ACL 2025表表示学习研讨会(TRL)接受
主题: 信息检索 (cs.IR) ; 人工智能 (cs.AI) ; 计算与语言 (cs.CL) ; 数据库 (cs.DB) ; 机器学习 (cs.LG)
[25] arXiv:2505.20591 (交叉列表自 cs.CL) [中文pdf, pdf, html, 其他]
标题: NL2SQL系统中提示优化的有效性
标题: Effectiveness of Prompt Optimization in NL2SQL Systems
Sairam Gurajada, Eser Kandogan, Sajjadur Rahman
期刊参考: NOVAS研讨会,SIGMOD 2025
主题: 计算与语言 (cs.CL) ; 数据库 (cs.DB)

2025年05月27日, 星期二 (展示 17 之 17 条目 )

[26] arXiv:2505.20230 (交叉列表自 cs.DB) [中文pdf, pdf, html, 其他]
标题: 面向从应用程序代码中自动提取和重构NoSQL模式的研究
标题: Towards the Automated Extraction and Refactoring of NoSQL Schemas from Application Code
Carlos J. Fernández-Candel, Anthony Cleve, Jesus J. García-Molina
评论: 投稿至《系统与软件》期刊,共23页
主题: 数据库 (cs.DB)
[27] arXiv:2505.19988 (交叉列表自 cs.DB) [中文pdf, pdf, 其他]
标题: 文本到SQL的自动元数据提取
标题: Automatic Metadata Extraction for Text-to-SQL
Vladislav Shkapenyuk, Divesh Srivastava, Theodore Johnson, Parisa Ghane
评论: 37页
主题: 数据库 (cs.DB)
[28] arXiv:2505.19918 (交叉列表自 cs.DB) [中文pdf, pdf, html, 其他]
标题: 一种统一的高效二元和最坏情况最优连接处理体系结构
标题: A Unified Architecture for Efficient Binary and Worst-Case Optimal Join Processing
Amirali Kaboli, Alex Mascolo, Amir Shaikhha
主题: 数据库 (cs.DB)
[29] arXiv:2505.19872 (交叉列表自 cs.DB) [中文pdf, pdf, html, 其他]
标题: 探索性数据分析中近似查询处理的自适应索引
标题: Adaptive Indexing for Approximate Query Processing in Exploratory Data Analysis
Stavros Maroulis, Nikos Bikakis, Vassilis Stamatopoulos, George Papastefanatos
评论: 关键词:近似聚合,增量索引,用户驱动采样,在线数据分析,误差界限查询,数据可视化,可视分析,聚合查询,大数据,人机交互
主题: 数据库 (cs.DB)
[30] arXiv:2505.19389 (交叉列表自 cs.DB) [中文pdf, pdf, html, 其他]
标题: MIMICEL事件日志的整理与分析——针对MIMIC-IV急诊科
标题: Curation and Analysis of MIMICEL -- An Event Log for MIMIC-IV Emergency Department
Jia Wei, Chun Ouyang, Bemali Wickramanayake, Zhipeng He, Keshara Perera, Catarina Moreira
主题: 数据库 (cs.DB)
[31] arXiv:2505.19302 (交叉列表自 cs.DB) [中文pdf, pdf, html, 其他]
标题: ODIN: 一个处理模式歧义的NL2SQL推荐系统
标题: ODIN: A NL2SQL Recommender to Handle Schema Ambiguity
Kapil Vaidya, Abishek Sankararaman, Jialin Ding, Chuan Lei, Xiao Qin, Balakrishnan Narayanaswamy, Tim Kraska
主题: 数据库 (cs.DB) ; 计算与语言 (cs.CL)
[32] arXiv:2505.19025 (交叉列表自 cs.DB) [中文pdf, pdf, html, 其他]
标题: SQUiD:从非结构化文本合成关系数据库
标题: SQUiD: Synthesizing Relational Databases from Unstructured Text
Mushtari Sadia, Zhenning Yang, Yunming Xiao, Ang Chen, Amrita Roy Chowdhury
主题: 数据库 (cs.DB) ; 计算与语言 (cs.CL)
[33] arXiv:2505.19001 (交叉列表自 cs.DB) [中文pdf, pdf, html, 其他]
标题: DARTH:基于早期终止的声明性回忆用于近似最近邻搜索
标题: DARTH: Declarative Recall Through Early Termination for Approximate Nearest Neighbor Search
Manos Chatzakis, Yannis Papakonstantinou, Themis Palpanas
评论: 本文发表于ACM SIGMOD 2026。
主题: 数据库 (cs.DB)
[34] arXiv:2505.18458 (交叉列表自 cs.DB) [中文pdf, pdf, html, 其他]
标题: LLM 调查$\times$数据
标题: A Survey of LLM $\times$ DATA
Xuanhe Zhou, Junxuan He, Wei Zhou, Haodong Chen, Zirui Tang, Haoyu Zhao, Xin Tong, Guoliang Li, Youmin Chen, Jun Zhou, Zhaojun Sun, Binyuan Hui, Shuo Wang, Conghui He, Zhiyuan Liu, Jingren Zhou, Fan Wu
评论: 请参阅论文列表:https://github.com/weAIDB/awesome-data-llm
主题: 数据库 (cs.DB) ; 人工智能 (cs.AI) ; 计算与语言 (cs.CL) ; 信息检索 (cs.IR) ; 机器学习 (cs.LG)
[35] arXiv:2505.18409 (交叉列表自 cs.DB) [中文pdf, pdf, 其他]
标题: 关于检查SQL事务混合隔离级别的复杂性
标题: On the Complexity of Checking Mixed Isolation Levels for SQL Transactions
Ahmed Bouajjani, Constantin Enea, Enrique Román-Calvo
期刊参考: CAV 2025完整版
主题: 数据库 (cs.DB) ; 编程语言 (cs.PL)
[36] arXiv:2505.20274 (交叉列表自 cs.LG) [中文pdf, pdf, html, 其他]
标题: 用于快速角度测试的概率核函数
标题: Probabilistic Kernel Function for Fast Angle Testing
Kejing Lu, Chuan Xiao, Yoshiharu Ishikawa
主题: 机器学习 (cs.LG) ; 人工智能 (cs.AI) ; 计算机视觉与模式识别 (cs.CV) ; 数据库 (cs.DB) ; 数据结构与算法 (cs.DS)
[37] arXiv:2505.20124 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: TUNA:密集动态视频中细粒度时间理解的综合评估
标题: TUNA: Comprehensive Fine-grained Temporal Understanding Evaluation on Dense Dynamic Videos
Fanheng Kong, Jingyuan Zhang, Hongzhi Zhang, Shi Feng, Daling Wang, Linhao Yu, Xingguang Ji, Yu Tian, Qi Wang, Fuzheng Zhang
评论: 已被CVPR 2025主会议录用。项目页面:https://friedrichor.github.io/projects/TUNA
主题: 计算机视觉与模式识别 (cs.CV) ; 数据库 (cs.DB) ; 多媒体 (cs.MM)
[38] arXiv:2505.19825 (交叉列表自 cs.LG) [中文pdf, pdf, html, 其他]
标题: 系统背景下的表格数据基础模型需要接地
标题: Foundation Models for Tabular Data within Systemic Contexts Need Grounding
Tassilo Klein, Johannes Hoffart
主题: 机器学习 (cs.LG) ; 人工智能 (cs.AI) ; 数据库 (cs.DB)
[39] arXiv:2505.19189 (交叉列表自 cs.IR) [中文pdf, pdf, html, 其他]
标题: 面向性能的查询分解器,用于多向量检索
标题: POQD: Performance-Oriented Query Decomposer for Multi-vector retrieval
Yaoyang Liu, Junlin Li, Yinjun Wu, Zhen Chen
评论: 发表于ICML 2025
主题: 信息检索 (cs.IR) ; 数据库 (cs.DB)
[40] arXiv:2505.18627 (交叉列表自 cs.CR) [中文pdf, pdf, html, 其他]
标题: 匿名性清洗
标题: Anonymity-washing
Szivia Lestyán, William Letrone, Ludovica Robustelli, Gergely Biczók
主题: 密码学与安全 (cs.CR) ; 数据库 (cs.DB)
[41] arXiv:2505.18363 (交叉列表自 cs.CL) [中文pdf, pdf, 其他]
标题: SchemaGraphSQL:使用路径搜索图算法的大规模数据库文本到SQL的高效模式链接
标题: SchemaGraphSQL: Efficient Schema Linking with Pathfinding Graph Algorithms for Text-to-SQL on Large-Scale Databases
AmirHossein Safdarian, Milad Mohammadi, Ehsan Jahanbakhsh, Mona Shahamat Naderi, Heshaam Faili
主题: 计算与语言 (cs.CL) ; 人工智能 (cs.AI) ; 数据库 (cs.DB)
[42] arXiv:2505.18351 (交叉列表自 cs.MA) [中文pdf, pdf, html, 其他]
标题: 人格炼金术:设计、评估和实现心理基础的LLM代理以代表多元利益相关者
标题: Persona Alchemy: Designing, Evaluating, and Implementing Psychologically-Grounded LLM Agents for Diverse Stakeholder Representation
Sola Kim, Dongjune Chang, Jieshu Wang
主题: 多智能体系统 (cs.MA) ; 计算机与社会 (cs.CY) ; 数据库 (cs.DB)
总共 42 条目
显示最多 50 每页条目: 较少 | 更多 | 所有
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号