计算机科学 > 数据结构与算法
[提交于 2025年7月8日
]
标题: 多队列 SSD I/O 建模及其对数据结构设计的影响
标题: Multi-Queue SSD I/O Modeling & Its Implications for Data Structure Design
摘要: 理解存储设备的性能特征以及如何最佳利用它们一直具有挑战性,这是由于存在诸如寻道时间、缓存、调度、并发访问、闪存磨损和垃圾回收等因素。 然而,提供存储性能简化抽象的分析框架仍然足够准确,可以在设计阶段评估外部内存算法和数据结构。 例如,磁盘访问机(DAM)模型假设存储设备以固定大小为B的数据块传输数据,并且所有传输都具有单位延迟。 这种抽象已经足以解释某些数据结构(如B树和日志结构合并树(LSM树))的一些优势;然而,存储技术的进步已显著降低了当前模型的准确性与实用性。 本文介绍了多队列固态硬盘(MQSSD)模型,这是一种新的存储抽象。 该模型建立在之前模型的基础上,旨在更准确地表示现代存储硬件的性能特征。 我们确定了现代多队列固态硬盘的关键性能关键方面,并在实际硬件上展示了这些特性。 然后,我们展示了如何将我们的模型应用于基于LSM树的存储引擎,以优化它们以适应现代存储硬件。 我们强调,利用并发访问对于充分利用多队列SSD的高吞吐量至关重要,这使得一些在传统范式下可能显得反直觉的设计成为可能。 随后,我们通过使用Facebook基于LSM树的键值存储RocksDB进行实验来验证这些见解。 我们得出结论,MQSSD模型比之前的模型提供了更准确的现代硬件抽象,从而能够获得更大的洞察力和优化空间。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.